Некоммерческая организация Open Data Platform Initiative (ODPi), целью которой является создание стандартной модели внедрения корпоративных приложений больших данных для дистрибутивов Apache Hadoop, выпустила первую спецификацию ODPi Runtime и пакет для тестирования.
В спецификацию входят правила и руководства по бесконфликтному внедрению дополнительных возможностей. Исходный код предоставляется посредством соответствующих процессов сообщества Apache.
«Это является кульминацией целого года работы», — заявил старший менеджер ODPi, Джон Мертик (John Mertic). Первостепенной задачей по его словам, было гарантировать максимальный охват всего сообщества Hadoop. «Главный урок, который мы извлекли из обратной связи, заключается в том, что каждый дистрибутив работает по своему; они именуют свои файлы по разному; их API действуют неодинаково».
Новая спецификация среды выполнения разработана на основе Apache Hadoop 2.7 и включает компоненты HDFS, YARN и MapReduce. Использование Apache Bigtop для компоновки пакетов, тестирования и настройки конфигурации гарантирует соответствие инструментов тестирования и самосертификации практикам Apache Software Foundation. Более половины кода последнего релиза Bigtop происходит из ODPi. Тесты ODPi Runtime-Compliance связаны напрямую со строками в ODPi Runtime Specification.
ODPi также предоставила референсную платформу ODPi Core. Созданные на её основе инструменты и приложения будут гарантированно работать с любой совместимой системой.
С выпуском Runtime Specification организация получила возможность двигаться дальше. По информации Мертика, на очереди теперь ODPi Operations Specification, которая позволит предприятиям упростить установку и администрирование Hadoop и приложений на её основе. Будущая спецификация охватит и Apache Ambari для управления кластерами Hadoop. Завершить работу над ней предполагается уже этим летом.
Дальнейшие планы ODPi требуют коллегиального утверждения, причём все участники организации, независимо от их величины и размеров инвестиций, получат по одному голосу. Среди возможных направлений будущей работы ODPi называют Spark, Kafka, HBase и Hive.