Активные архивы в хранении данных

С ростом объемов сохраняемой информации владельцы данных пересматривают подходы к организации хранения. Оперируя архивами в сотни терабайт, иначе смотришь на средства управления данными, их защиту, приоритеты и затраты.

Понятие «активное архивирование» вошло в оборот сравнительно недавно. Так называют долгосрочное хранение информации с обеспечением активного доступа к любой части архива, в режиме реального времени. Количество неструктурированных данных в хранилищах растет, ими надо эффективно управлять. Выделяемые в отдельный класс систем хранения, активные архивы используют индексацию, метаданные, объектную структуру и протоколы, алгоритмы защиты данных с кодом избыточности.

Erasure Coding против RAID

Повторяя иллюстрацию, можно сказать, что системы активного архива накрывают весь диапазон ответственного хранения, за исключением волатильных данных. Первичные (primary) хранилища подбираются под специфику и типы запросов критичных приложений. Все значимые данные, к которым нужен живой доступ на протяжении длительного времени, выносят в активные архивы.

Архивы – не бэкапы
Активное архивирование и резервное копирование принципиально различны: по целям, структуре данных, процедуре копирования, организации доступа.

Резервирование – это рутинное копирование операционных данных (активной и неактивной информации), для последующего восстановления работоспособности после сбоев основной системы (disaster recovery), в коротком горизонте планирования. Системы резервного копирования оптимизированы под быстрый доступ к большим объемам информации и нужны для скорого восстановления работы приложения или системы в целом.

Активные архивы объединяют наборы данных с их свойствами, детализацией и взаимосвязями (метаданными) для оперативного доступа к ним. Это актуальная информация, не копии. Причина переноса данных в архив – снижение затрат. Проиндексированный активный архив избирательно и быстро работает с индивидуальными объектами, обеспечивая им продолжительное надежное хранение.

Активное архивирование - не HSM
В отличие от систем иерархического хранения (Hierarchical Storage Management, HSM), данные активных архивов находятся в живом доступе, вне зависимости от их возраста и частоты обращения. Политики HSM построены на перемещении информации между уровнями (tiers) и устройствами хранения. Активный архив обслуживает пользователей как первичный и все остальные пулы хранения. Данные отдает то устройство, на котором они размещены. Благодаря метаданным, администрирование требует минимума времени и вычислительных ресурсов.

Архивы, активы…
Интенсивно изменяемые данные (как транзакционные базы) в системах активного архива не хранят. Чем выше объем хранения, и чем больше приложения ориентированы на чтение – тем уместнее архивирование. Данные статичной природы могут не терять ценность годами, оставаясь основным активом многих видов бизнеса. Сам термин «активы» подчеркивает важность всей хранимой информации для владельца. Разбухание архивов – сигнал для пересмотра подходов к хранению.

Размещение данных на дискретных первичных, вторичных и третичных системах хранения множит хаос пропорционально росту объемов сохраняемой информации. Сводя все более-менее статичные данные в активные архивы, пользователи получают не просто консолидированную платформу для размещения информации. Обеспечивается запас масштабирования, высокий уровень защищенности данных, быстрый поиск контента, целостность данных, мониторинг состояния систем и энергоэффективность.

Активные архивы построены на балансе цены и производительности. Скоростных стандартов для них нет, все зависит специфики данных и приложений. Тип и количество носителей внутри архива определяются требованиями доступности данных. В целом, задержки доступа к данным систем активного архива составляют от миллисекунд до сотен миллисекунд.

Объектное хранение
Где есть временные наслоения объемных данных - появляется смысл в объектном хранении. Объектный подход удобен для размещения больших массивов неструктурированной информации: он дает свободу масштабирования, отделяет метаданные от данных, избавляет от привязки к определенной файловой системе или блочным устройствам. Администраторам незачем беспокоиться установкой уровней RAID, созданием и управлением логическими томами. Объектное хранение – естественный спутник архивирования, с запасом по росту и предрасположенностью к переносу данных в облака.

Обсуждалась проблема интеграции ленточных библиотек в объектные хранилища («вы не можете сбросить объекты на ленту»). Уже можно. Но, справедливости ради, активные архивы потому и названы так, что обеспечивают доступ к данным в реальном времени, с приемлемыми задержками. Нужна лента – пользуйтесь пассивным архивом и средствами репликации одного в другое.

Активные архивы в хранении данных

RAID и Erasure Coding
Erasure coding – это подход, идущий на смену RAID в объемном хранении. Используется в системах активного архива, с разными политиками. Оригинальные данные разбиваются на фрагменты, те дополняются фрагментами с кодами избыточности, достаточно сложные алгоритмы считают и распределяют данные по носителям и серверам хранения. Запись таких фрагментированных данных требует значительных вычислительных ресурсов (потому Erasure coding применяется в архивах, менее критичных к производительности, чем к сохранности данных) . Зато архив с Erasure coding переживет отказ, скажем, 6 дисков из каждых 16. Или 6 серверов с дисками, причем они могут быть расположены на разных площадках, связанные WAN.

Акторы активного архивирования

Активные архивы в хранении данных

В 2010-м году образовался альянс активного архивирования (Active Archive Alliance, AAA) – инициативное объединение для продвижения технологий продолжительного хранения с живым доступом. Участники альянса ищут пути упрощения хранения, популяризации масштабируемых решений, снижения стоимости владения, снижения рисков потери данных. Кроме бизнеса - как суперкомпьютеры или создание медийного контента, активные архивы нужны в областях общественного интереса - как наука, образование, институты по сохранению культурного наследия. Вот, в качестве примера, детальное описание, на чем и как хранит оцифрованные архивы фестиваль джазовой музыки в Монтрё.

Обзор был бы неполным без примера программно-аппаратной реализации активного архива. Хорошо документировано решение HGST Active Archive SA-7000.

Как устроен активный архив

Активные архивы в хранении данных

HGST Active Archive (далее AA) – представляет собой готовую к работе, укомплектованную систему хранения с предустановленным ПО, в формате стойки 42U. В ней есть три управляющих узла с SSD и шесть серверов хранения, к которым подключены шесть JBOD, по 98 дисков 8 TB в каждом (HGST Helium). JBOD управляются как блочные устройства хранения, по SAS. В управляющих серверах стоят SSD достаточной емкости, чтобы обслужить метаданные по более чем 1 800 000 000 объектов данных в расчете на одну стойку AA.

В AA реализовано объектное обращение к данным, по протоколу S3 или через REST API/HTTP. Физический интерфейс подключения – 6 х 10 Gb Ethernet. Для выставленных в интернет хранилищ рекомендуются фаерволы и балансировка нагрузки. В стойке есть два сетевых коммутатора – для отказоустойчивости внутренних и внешних соединений. Таких стоек на одной площадке можно разместить до шести, соединяя их интерфейсом 40 Gb Ethernet.

Программное обеспечение HGST AA разработано компанией Amplidata, которую HGST купила в 2015 году.

Производительность и возможности
Достижимая производительность для объектного хранилища по S3 – до 3.5 GB/s в операциях GET и зависит от размера объектов и количества сконфигурированных в системе потоков/демонов. Операции PUT обычно на 37% медленнее – из-за вычислений кода коррекции ошибок ECC и из-за того, что PUTs обрабатывает больше данных, чем GETs – 18 фрагментов объектов против 13, при кодировке Erasure coding 18/5.

Активные архивы в хранении данных

Задержка доступа к объектам не превышает <100ms в более чем 90% случаев. С добавлением стоек AA производительность масштабируется линейно. При среднем размере объекта > 1.9 MB достигается полная утилизация пространства 2.967 PB под метаданные и объектное хранение при кодировании по схеме 18/5.

Максимальный допустимый размер объекта – 16TB, а число объектов в расчете на стойку - 1.800.000.000.
Каждый контроллер стойки может обслужить 1000 активных HTTP-подключений. В стойке три контроллера, суммарной способностью 3000 подключений. При добавлении соответствующих шлюзов подключений может быть намного больше.

Защита данных
В HGST AA используется Erasure coding – подход к защите данных, превосходящий RAID в хранилищах большой емкости и масштабируемых внедрениях. Пользовательские данные непрерывно мониторятся на сбойные блоки (до 1000 однобитных ошибок подряд могут быть исправлены генерируемым системой кодом ECC). При отказе диска и потере фрагментов некоторых объектов, все эти фрагменты восстанавливаются по оставшимся данным других дисков и распределяются по дискам по заданному алгоритму. Процесс восстановления потерянных фрагментов с помощью Erasure Coding протекает намного быстрее, чем в RAID-массиве.

HGST выбрала правило Erasure Coding BitSpread, или 18/5 – как лучший компромисс, с эффективностью 63% для объектов >512kB и высокой пропускной способностью до 3.5GB/s на стойку. Для географически распределенных реализаций HGST использует GeoSpread, или правило 18/8 – чтобы пережить полный отказ одной из площадок, еще одного JBOD и еще двух HDD, без потери данных, при 50%-й эффективности.

Каждый размещаемый объект защищен кодом коррекции ошибок ECC и разбивается на 18 фрагментов, из которых достаточно любых 13 для полного восстановления данных. Другими словами, система устойчива к потере 5 дисков. Схема 18/5 применяется ко всем объектам > 512kB.

Для объектов <= 512kB применяется политика малых объектов: схема хранения 7/5, содержащая одну копию 1:1 для ускорения доступа и копию c Erasure Coding 6/4. Сохраняется устойчивость к потере 5 дисков, как и для больших объектов.

Шлюзы
Файлы NFS или CIFS можно перемещать на HGST AA с помощью сторонних шлюзов (gateways). Если для создания объектов используются шлюзы, ими же пользуются для доступа: из-за структуры метаданных, механизмов доступа, способа разбиения объектов на блоки.

Объекты хранения на HGST AA считаются статичными - что справедливо для большинства наборов данных, переживших фазу их создания: фотографии, сканы, электронные таблицы, видеоклипы, готовые проекты, снэпшоты, бэкапы каталогов, дисков и целых систем.

База данных не может стать объектом, потому что обновляется и модифицируется слишком часто. К постоянно изменяемому контенту не обращаются как объектам - это породило бы активный пересчет ECC и перезапись всех фрагментов объектов (в нашем случае 18), бесполезную, но затратную дополнительную вычислительную нагрузку. Но пользователи вполне могут создавать базы данных объектов с привязанными к объектам метаданным.

Протоколы
S3 для облачного доступа
Система совместима с протоколом Amazon Simple Storage Service (AWS S3 - http://aws.amazon.com/documentation/s3/).

REST
REST-API документирован в руководстве пользователя HGST AA.

Для подключения по FTP / SFTP, iRODs, NTFS и др протоколам нужны шлюзы/коннекторы с S3
Поставляются сторонними компаниями.

Управляющее ПО HGST AA – это зрелый продукт компании Amplidata. До сделки поглощения он развивался 7 лет и продавался как программно-определяемое решение хранения. С багажом HGST в создании емких дисков, JBOD и средств управления ими получившееся программно-аппаратное решение выходит на верхний уровень в области систем хранения, оставаясь при этом привлекательным по цене.

Quanto?
Полная стойка емкостью 4.7 PB обойдется не дороже 800К евро. Можно начать со стартового набора за 300K евро. В него входят все управляющие серверы, но только один JBOD емкостью около 700 TB. Для наращивания емкости хранения докупаются JBOD с дисками.

Стратегія охолодження ЦОД для епохи AI

Чи використовує ваша компанія ChatGPT в роботі?

Колонка

BEST CIO

Человек года

Продукт года

Читайте также

Останні обговорення

ТОП-новини

ТОП-блоги

ТОП-статті