Компания Amazon сделала ландшафт графовых баз данных гораздо более интересным, анонсировав общую доступность СУБД AWS Neptune. Благодаря этому релизу, выводящему нишевую технологию на массовый простор, пользователи получат более широкий выбор и расширенные функциональные возможности.
Neptune имеет дуалистичную природу, поддерживая обе преобладающие модели графовых БД: RDF и Property Graphs (PG). AWS отмечает, что людям, имеющим опыт работы с реляционными БД, как правило проще осваивать PG, реализованную посредством API языка обхода графов Gremlin. RDF с её языком запросов SPARQL имеет преимущества для обмена данными и сценариев интеграции информационных массивов, таких как Wikidata.
Двойственность Neptune проявляется и в частичной поддержке аналитических приложений OLAP, хотя на данном этапе эта СУБД имеет преимущественно транзакционную (OLTP) направленность. Neptune поддерживает обход в 3 или 4 этапа, несвязанные графы, комбинации со сложной фильтрацией, а также агрегацию — посредством как SPARQL так и Gremlin.
К минусам можно отнести сложность взаимодействия двух моделей: фактически пока это две СУБД, существующие самостоятельно. Попытки унификации представления RDF/PG, предпринимаемые AWS, далеки от успеха. Импорт данных CSV, RDF и GraphML возможен только для статических файлов. AWS утверждает, что для динамического импорта можно применять потоки DynamoDB, но код для этого пользователям придётся писать самим. Аналогична ситуация с экспортом — возможен с помощью SPARQL и Gremlin, однако неудобен и отсутствуют соответствующие утилиты.
Обходные и зачастую небесплатные пути придётся использовать для продвинутой работы с аналитикой Spark или GraphX, для «умозаключений» (inference) RDF и даже для визуализации графов.
Главные плюсы Neptune сейчас это готовность и надёжность: поддержка до 100 млрд вершин/рёбер/триплетов, автоматическая репликация шести копий данных на три Availability Zone (AZ) и непрерывный бэкап в S3. AWS утверждает, что Neptune ACID-совместима в SPARQL и Gremlin и предлагает повторные считывания актуальных во всех AZ данных с интервалом менее 10 мс.
Для Neptune обещана готовность 99.99 процентов, проблемы с данными автоматически выявляются и в большинстве своём устраняются менее, чем за 30 секунд. Подвинутые возможности защиты Neptune включают Amazon Virtual Private Cloud (VPC) и шифрование стационарных данных с помощью AWS Key Management Service (KMS).
Среди первых клиентов Neptune в пресс-релизе фигурируют Samsung Electronics, Pearson, Intuit, Siemens, AstraZeneca, FINRA, LifeOmic, Blackfynn и Amazon Alexa. Области применения варьируются от обнаружения махинаций до медицинских исследований.