Создана открытая модель для работы со сложными массивами данных

6 январь, 2020 - 14:35

 

Создана открытая модель для работы со сложными массивами данных

Большие наборы данных сложно использовать кому-либо, кроме их обладателей. Программное обеспечение часто является проприетарным, а сами файлы из-за их размера трудно передавать по электронной почте или через облачный сервер. Кроме того, при экспортировании часто теряются важные метаданные, которые объясняют, что на самом деле представляет собой набор данных.

Исследовательская группа из Университета штата Огайо в кооперации с Орхусским университетом (Дания) и Университетом Орлеана (Франция) разработала систему управления данными с доступным в Сети исходным кодом, которая, как надеются ученые, решит все эти проблемы. О системе, получившей название Core Scientific Data Model (CSDM), разработчики рассказали в свежем выпуске журнала PLOS ONE.

Создана открытая модель для работы со сложными массивами данных

«Мы хотели создать файловый формат и модель данных, которые бы инкапсулировали большинство наборов данных, с которыми мы работаем на всех приборах в лаборатории», — сказал Филипп Грандинетти (Philip Grandinetti), профессор химии в Университете штата Огайо и старший автор статьи.

Учёные надеются, что ПО CSDM, уже предлагаемое ими для PC и Мас, предоставит простой и бесплатный способ комбинирования многих типов данных.

«Если бы мы могли просто экспортировать данные как этот один тип файла (основной тип файла научных данных) вместо того, чтобы искать и извлекать их из наборов данных — мы смогли бы работать в общей системе», — сказал Дипанш Шривастава (Deepansh Srivastava), участник исследовательской группы профессора Грандинетти.