AWS объявила о выходе графовой СУБД Neptune

4 июнь, 2018 - 08:45
AWS объявила о выходе графовой СУБД Neptune

Компания Amazon сделала ландшафт графовых баз данных гораздо более интересным, анонсировав общую доступность СУБД AWS Neptune. Благодаря этому релизу, выводящему нишевую технологию на массовый простор, пользователи получат более широкий выбор и расширенные функциональные возможности.

Neptune имеет дуалистичную природу, поддерживая обе преобладающие модели графовых БД: RDF и Property Graphs (PG). AWS отмечает, что людям, имеющим опыт работы с реляционными БД, как правило проще осваивать PG, реализованную посредством API языка обхода графов Gremlin. RDF с её языком запросов SPARQL имеет преимущества для обмена данными и сценариев интеграции информационных массивов, таких как Wikidata.

Двойственность Neptune проявляется и в частичной поддержке аналитических приложений OLAP, хотя на данном этапе эта СУБД имеет преимущественно транзакционную (OLTP) направленность. Neptune поддерживает обход в 3 или 4 этапа, несвязанные графы, комбинации со сложной фильтрацией, а также агрегацию — посредством как SPARQL так и Gremlin.

К минусам можно отнести сложность взаимодействия двух моделей: фактически пока это две СУБД, существующие самостоятельно. Попытки унификации представления RDF/PG, предпринимаемые AWS, далеки от успеха. Импорт данных CSV, RDF и GraphML возможен только для статических файлов. AWS утверждает, что для динамического импорта можно применять потоки DynamoDB, но код для этого пользователям придётся писать самим. Аналогична ситуация с экспортом — возможен с помощью SPARQL и Gremlin, однако неудобен и отсутствуют соответствующие утилиты.

Обходные и зачастую небесплатные пути придётся использовать для продвинутой работы с аналитикой Spark или GraphX, для «умозаключений» (inference) RDF и даже для визуализации графов.

Главные плюсы Neptune сейчас это готовность и надёжность: поддержка до 100 млрд вершин/рёбер/триплетов, автоматическая репликация шести копий данных на три Availability Zone (AZ) и непрерывный бэкап в S3. AWS утверждает, что Neptune ACID-совместима в SPARQL и Gremlin и предлагает повторные считывания актуальных во всех AZ данных с интервалом менее 10 мс.

Для Neptune обещана готовность 99.99 процентов, проблемы с данными автоматически выявляются и в большинстве своём устраняются менее, чем за 30 секунд. Подвинутые возможности защиты Neptune включают Amazon Virtual Private Cloud (VPC) и шифрование стационарных данных с помощью AWS Key Management Service (KMS).

Среди первых клиентов Neptune в пресс-релизе фигурируют Samsung Electronics, Pearson, Intuit, Siemens, AstraZeneca, FINRA, LifeOmic, Blackfynn и Amazon Alexa. Области применения варьируются от обнаружения махинаций до медицинских исследований.