Виртуализация в системах хранения — решение «на вырост»

15 сентябрь, 2011 - 13:16Тимур Ягофаров

Технология виртуализации стала в последнее время настолько популярной, что не сходит с «передовиц» специализированных веб-ресурсов и из программ конференций всех крупных ИТ-игроков. Зачастую складывается впечатление, что это понятие используют не по назначению. Но в отношении систем хранения виртуализация вполне применима, и мы предлагаем вам на примере достаточно известного решения HP познакомиться с тем, что же представляют собой виртуализированные СХД и какие их преимущества могут оказать помощь в работе системного администратора.

Немного об истории

Внедрением технологии виртуализации в системы хранения HP занялась еще в начале этого века, выпустив в 2001 г. первое поколение таких решений, которые получили название Enterprise Virtual Array (EVA). За десять лет сменилось пять поколений этих СХД, а их общая инсталлированная база в глобальных масштабах превысила 100 тыс. шт., что свидетельствует о том, что это решение достаточно хорошо изучено специалистами и проверено на практике в самых разнообразных инфраструктурах.

В течение всей своей десятилетней истории существования в наименовании этих СХД использовалась аббревиатура EVA, и лишь в начале нынешнего лета после ребрендинга линейки систем хранения HP данное семейство получило название P6000, где отсутствует явное упоминание о виртуализации. Это можно объяснить тем, что в конце 2010 года в номенклатуре HP после покупки компании 3PAR появилось еще одно семейство виртуализированных СХД, оптимизированных для облачных вычислений и сервис-провайдеров. Они построены на том же принципе, что и P6000, но отличаются использованием в их составе специализированных ASIC, где на аппаратном уровне реализованы алгоритмы обработки запросов. Поэтому в дальнейшем речь пойдет лишь о серии P6000, как ориентированной на более широкий круг заказчиков. Хотя стоит иметь ввиду и существование гораздо более мощных систем 3PAR.

Виртуализация в системах хранения — решение «на вырост»

Так что же такое виртуализированное СХД?

Коль в качестве примера мы взяли решение HP P6000, то рассмотрим его структуру. По сути это набор из пары контроллеров, к которым подключается до 20 дисковых полок, что обеспечивает масштабируемость до 450 SFF или 240 LFF дисков в старшей модели. Контроллеры доступны с разным набором портов для включения в сеть хранения данных, начиная с моделей с одними лишь портами Fibre channel , и заканчивая моделями, которые могут включаться в сети хранения данных FC, iSCSI, FC over Ethernet. Но все же главным его отличием от широко распространенных систем является установленная здесь специализированная ОС и ПО управления накопителями с использованием технологии виртуализации. Вы наверняка уже знаете, что ее суть заключается в том, чтобы сформировать между ОС и аппаратной платформой программную прослойку, которая позволяет выделять ресурсы сразу нескольким задачам, выполняемым в разных операционных системах, чтобы они работали независимо друг от друга и не обращались к аппаратной платформе напрямую. При этом повышается эффективность ее использования. Если речь идет о серверах, то тут разделяются ресурсы процессора, оперативной памяти и Ethernet-адаптера. Поэтому вполне логично появление и систем хранения, дисковое пространство которых также виртуализируется.

Для того чтобы отличие виртуализированных СХД стало более понятным, напомним, как работают традиционные системы хранения, предназначенные для построения SAN (Storage Area Network). Если в рамках обычного СХД формируется RAID-массив, то в него включаются конкретные жесткие диски, установленные в полку. При этом после формирования нескольких таких RAID-массивов может остаться запасной накопитель, не задействованный ни в одном из них и предназначенный в качестве запасного на случай выхода из строя какого-либо из включенных в RAID-массивы. В таком варианте любая перестройка последних, связанная c изменением требований по производительности или емкости, приводит к большим расходам времени.

В отличие от традиционных СХД, в виртуализированных системах хранения оперируют не отдельными жесткими дисками, а логическими блоками, на которые поделены все входящие в его состав накопители. При этом в рамках одного СХД HP P6000 может быть от одной до 16 виртуальных дисковых групп, на базе которых формируются RAID-массивы. А при формировании LUN необходимые для этого блоки могут располагаться на всех жестких дисках группы, причем метод сборки определяется целым рядом факторов, о которых мы поговорим позже. В состав одного СХД может входить до 2048 LUN, размер логического раздела меняется шагами по 1 ГБ до максимального значения 32 ТБ.

Преимущества виртуализированных СХД

Принципиальным отличием виртуализированных СХД является возможность увеличивать или уменьшать любой входящий в их состав LUN «на ходу» без остановки работы системы. Заметим, что в виртуализированных СХД отсутствует понятие «запасной жесткий диск». На всех накопителях есть свободное пространство, которое может быть использовано для перестройки, если выйдет из стоя один или несколько жестких дисков данной группы. Причем, осуществляется это в фоновом режиме незаметно для тех приложений, которые обращаются к СХД.

Есть у виртуализированных СХД и преимущество в производительности данного логического раздела по сравнению с традиционными системами хранения. Ведь если в последних она определяется числом жестких дисков в составе RAID-массива, то в виртуализированных — зависит от количества накопителей в дисковой группе, которых обычно гораздо больше.

Еще одна важная особенность виртуализированных СХД — поддержка в них функции «тонкого выделения» (thin provisioning). Ее суть заключается в том, что под LUN может выделяться виртуальное дисковое пространство, объем которого больше имеющегося физического. Это делается в тех случаях, когда заранее не известно насколько вырастет потребность того приложения, для которого предназначен данный раздел. Контроллер отслеживает процесс наполнения его данными, и когда будет достигнуто заданное заранее пороговое значение, выдаст предупреждение об этом системному администратору. А уже ему предстоит решать, каким образом расширять LUN: либо перераспределяя имеющееся дисковое пространство, либо добавляя новые диски в полку.

Использование функции «тонкого выделения» позволяет не только сэкономить средства на момент приобретения оборудования, но и приводит к сокращению потребления электроэнергии (до 45%), так как отпадает нужда в эксплуатации пока неиспользуемых жестких дисков. Применение данной функции не зависит от типа используемой ОС, так как реализовано в самом контроллере.

Понятно, что этот метод не годится для тех приложений, которые сразу захватывают весь LUN, форматируя его под свои нужды. Но для таких случаев можно использовать более высокоуровневое решение семейства HP 3PAR, здесь контроллеры умеют распознавать подобные операции и блокируют их на аппаратном уровне.

Еще одной интересной особенностью виртуализированных СХД является возможность реализовать в рамках одной системы сразу несколько хранилищ с различными уровнями производительности (от Tier 1 до Tier 3). Напомним, что обычно СХД различных уровней входят в состав ИТ-инфраструктуры. При этом те, что имеют наибольшую производительность, относят к первому уровню: они используются для хранения часто обновляемой информации. А второй и третий уровни — это менее быстрые, но при этом обычно и менее дорогие системы, поэтому их предназначение — работа с той информацией, что обновляется не так часто. Так вот в рамках виртуализированных СХД можно формировать виртуальные накопители, которые будут относиться к различным уровням по производительности.

Секрет тут заключается в том, что в дисковые полки можно устанавливать жесткие диски разных типов. К примеру, в Tier 1 можно объединить SAS-накопители со скоростью вращения шпинделя 15000 об/мин, в Tier 2 — SAS 10000 об/мин, а в Tier 3 — SAS 7200 об/мин. В этом случае на Tier 1 располагают индексы БД, на Tier 2 — активно используемые данные и информацию для мгновенного восстановления, а на Tier 3 — нечасто востребованные файлы и резервные копии. Контроллер умеет распознавать эти жесткие диски и объединяет их в группы по типам. Таким образом, можно более эффективно потратить средства на создание решения, которое сможет удовлетворить противоречивым требованиям: с одной стороны обеспечить высокую производительность, а с другой — при ограниченном бюджете создать достаточно вместительное хранилище на базе более доступных по цене жестких дисков.

Практика применения

Понятно, что только в практическом применении можно выявить насколько то или иное решение в состоянии справиться с реальными задачами бизнеса. Поэтому за экспертным мнением о применении виртуализированных СХД HP мы обратились в компанию Integrity Systems — единственную в Украине обладающую компетенцией HP Storage Works в рамках программы HP Gold Preferred Partner.

По словам Войтовича Евгения, руководителя технического отдела компании, виртуальные системы хранения данных становятся все более актуальными с приближением эры облачных вычислений, а у НР уже накоплен 10 летний опыт и имеется три независимо развивающихся продукта, что обеспечивает конкурентное преимущество перед другими производителями систем хранения данных. Например, за время присутствия на рынке СХД EVA P6000 в мире было реализовано свыше 100 тыс таких устройств. Что же касается новой линейки этих СХД, то она не только значительно продвинулась технологически, но и стала доступнее по цене, по сравнению с ее предшественниками. Среди усовершенствований, реализованных в новой версии P6000, представленной в начале этого лета, стоит отметить появление уже в базовой версии системы функций Thin Provisioning и Dynamic Capacity Management, которые значительно упрощают работу системного администратора.