`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Что для вас является метрикой простоя серверной инфраструктуры?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Контроллеры модульных систем хранения

+33
голоса

В отличие от традиционных, модульные системы хранения состоят из контроллеров (аппаратных или программно-определяемых) и JBOD — автономных контейнеров с дисками.

Традиционные СХД

В отказоустойчивых системах хранения, как правило, есть пара управляющих контроллеров («голов») и общая дисковая корзина. Контроллеры обслуживают трафик данных, рассчитывают контрольные суммы (коды избыточности), выполняют служебные функции — работают дуэтом по логике, определенной производителем. Две «головы» аппаратной СХД — по сути, два специфических сервера, которые согласованно обращаются к дискам по интерфейсу SAS.

С точки зрения производителей, пользователю ни к чему интересоваться внутренним устройством системы хранения, его дело — выбрать подходящее по уровню, параметрам и бюджету готовое коробочное решение. Оставшейся свободой маневра будет выбор накопителей (из списка совместимости, другие работать не будут) и некоторых опциональных расширений.

Смуту внес приход программно-определяемого хранения. Подрывая жесткие рамки SAN и NAS, операторы объемных данных стирают моноблочные стереотипы и отделяют управление от собственно хранения. Роль контроллеров берут на себя типовые серверы х86, за специализацию и взаимодействие серверов отвечает ПО. Диски выносят в отдельные контейнеры JBOD и подключают к хостам по SAS. Все просто: эластичность и управляемость данными модульных СХД выше, чем в традиционных.

Место и роль JBOD

JBOD — не альтернатива системам хранения, а их фундамент, поверх которого строятся стратегии размещения данных. Вынос дисков в отдельный конструктив помогает сосредоточиться на предметной области. Вместо кастинга коробок — управлять данными: анализировать нагрузки ввода-вывода, подбирать под них ПО и ресурсы процессоров, памяти, сети для обслуживания запросов серверами. Диски-то все равно у всех одинаковые (и лучше бы им жить отдельно, а подбор накопителей под профиль нагрузок — отдельный ресурс оптимизации).

В JBOD под корпоративные приложения дублированы подсистемы (модули ввода-вывода / экспандеры / пути доступа / вентиляция / питание). Примерами могут служить HGST 4U60 и 2U24. Первый — 60-дисковый JBOD на механических дисках емкостью до 720TB. Второй — хранилище на 24 SSD, емкостью до 184TB. Поставляются как полностью, так и частично заполненные дисками, с запасом по росту хранения.

Areca ARC-9200

В мире аппаратных СХД не принято отделять «головы» от контейнеров с дисками, но есть исключения. Один из могикан RAID-контроллеров, Areca, вывела на рынок решение ARC-9200. Это двухконтроллерная система управления хранением в исполнении 1U, без дисков. Они бывают трех разновидностей — по типу блочного доступа хостов сети (12Gb SAS, 16Gb FC или 10Gb iSCSI). Выбрав нужную, пользователь получает полную дисковую свободу: подключай JBOD с дисками — и работай. Фактически, Areca ARC-9200 — это сдвоенный аппаратный RAID-контроллер c фронтальным интерфейсом пользователя. Спарка работает по схеме Active-Active, с внутренней синхронизацией по скоростной шине PCIe 3.0. Кроме отказоустойчивости, реализована балансировка нагрузки — распределение по контроллерам потока запросов к ресурсам (томам/LUN’ам). У каждого из них есть два порта 12Gb SAS под JBOD.

Контроллеры модульных систем хранения

Контроллеры модульных систем хранения

Аппаратные и программно-определяемые модульные СХД

Программно-определяемой альтернативой отказоустойчивой аппаратной СХД с общими дисками служит кластер серверов с общим JBOD.

Модульная СХД (как Areca ARC-9200) предоставляет такую же топологию доступа серверов-инициаторов к данным (JBOD), что и два сервера под управлением кластерной ОС хранения.

Контроллеры модульных систем хранения

Модульная аппаратная СХД

Контроллеры модульных систем хранения

Программно-определяемая СХД

СХД различаются реализациями Active-Active, производительностью, набором служб.

Какой RAID лучше, аппаратный или программный?

Лучше тот, который подходит под задачу и бюджет.

Технологию RAID «хоронят» давно: ОС со встроенными средствами логической организации данных, гиперконвергентные инфраструктуры, коммутируемые среды с многократным дублированием. Но он (пока) жив.

RAID без расчета четности (уровни 1, 10) привычен в транзакционных приложениях со случайным обращением к данным. В объемном хранении в ходу RAID 6 с чередованием и двойной четностью: при нынешних емкостях дисков деградированный массив восстанавливается долго, а для RAID 5 с одной четностью повторный отказ фатален. RAID 6 устойчив к потере двух накопителей. Как и RAID 5, он основан на кодах Рида — Соломона, но его производительность ниже на 10-15% — из-за бо́льшего объёма вычислений (сложнее алгоритм расчета контрольных сумм), и накладных расходов ввода-вывода.

Основная проблема классического RAID 6 — медленная запись случайного доступа, за счет большого, втрое против RAID 1-10, количества дисковых операций. Разработчики ищут компромисс между производительностью, добавленными сервисами (которые съедают производительность) и ценой реализации. Каждый по-своему.

NetApp

Например, NetApp в своих системах хранения не использует аппаратные RAID- контроллеры. Проблема parity random write penalty решается средствами файловой системы WAFL (write anywhere file layout) — для которой RAID просто еще один уровень логической организации данных. Единожды записанные блоки данных не перезаписываются поверх, запись направляется в свободные блоки (anywhere), после чего в таблице размещения файлов переставляется указатель, со старых блоков на новые. Такая стратегия позволяет превратить случайную (random) запись в последовательную (sequential) — что быстрее и удобнее для системы. Вместо перезаписи отдельных блоков в разные области хранения, блоки накапливаются в NVRAM, после чего сформированная «полоса» данных пишется разом на все диски RAID, включая блоки четности. RAID-DP (diagonal parity, double parity) — нетапповский ответ на RAID 6. Недостаток WAFL — фрагментация данных и деградация производительности массива с его заполнением.

ZFS

Файловая система ZFS встречается в системах хранения Oracle, у ряда коммерческих разработчиков ОС хранения и развивается открытым сообществом OpenZFS. В ней тоже есть программная реализация RAID и используется похожая на WAFL стратегия записи на свободное место cow (copy-on-write). RAID-Z c четностью, как и RAID 5, устойчив к потере одного диска. RAID-Z2 с хранением информации о четности в двух местах — аналог RAID 6/ RAID-DP. В RAID-Z и RAID-Z2 используется динамический размер страйпа, что дает преимущество в скорости — не нужно выполнять чтение перед записью, так как отсутствуют частичные записи страйпов.

Raidix

Операционная система для хранения данных Raidix тоже обходится без аппаратных RAID-контроллеров, хотя и построена на классическом принципе перезаписи данных по месту (read-modify-write). Для вычислений в ней используются SSE-инструкции стандартных процессоров Intel Xeon. Скорость потоковой обработки остается высокой даже при пересчете контрольных сумм RAID 7.3 (переживет одновременный отказ трех дисков). Стабильная производительность и надежность принесли Raidix признание в видеопроизводстве, где критичны стабильно ровные характеристики при записи больших объемов потоковых данных. Другие области применения Raidix — HPC, документооборот, видеонаблюдение.

Areca

В аппаратных контроллерах RAID 5/6 записываемые данные сохраняются в кэше (DRAM) на то время, пока будет выполнено синхронное чтение. Их производительность зависит от вычислительной мощности процессоров контроллеров и эффективности использования кэш-памяти под разными шаблонами нагрузок.

Контроллеры Areca ARC-9200 построены на классическом RAID On Chip с кэш-памятью. Синхронизируется память двух контроллеров по быстродействующей внутренней шине PCIe, с минимальным временем переключения служб при отказе одного из контроллеров.

Производитель намеренно отказывается от использования ряда служб — как дедупликация, кэширование, тиринг, мгновенные снимки — ради удешевления продукта. Все они расходуют процессорный ресурс и понятно, что на поле дополнительных сервисов программно-определяемые получат преимущество, за счет возможности гибко выделять ресурсы. Areca берет ценой.

Что выбрать?

Какая бы ни была СХД, монолитная или модульная, выбор диктует задача. В случае модульных систем появляются дополнительные степени свободы. Нужны они пользователю или нет — решать ему. Программно-определяемые системы хороши своим охватом, адаптивностью по нагрузкам, объемам хранения и добавляемым сервисам. Если просто нужна непрерывность доступа к данным, высокая производительность в базовых операциях и бюджетное масштабирование емкости хранения — двухконтроллерная аппаратная «голова» все решит за вас.

+33
голоса

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT