Технологии виртуализации ресурсов хранения данных, FalconStor IPStor и немного аналитики

30 март, 2006 - 23:00Сергей Грицачук

Широкое распространение «островков данных», построенных на базе сетевых хранилищ SAN, породило целый ряд причин, вызвавших необходимость виртуализации ресурсов хранения. Далеко не новая технология оказалась вновь востребованной, вступив в очередной виток своего развития. Но несмотря на явную незаполненность ниши наиболее продвинутые решения принадлежат отнюдь не компаниям класса A-brand...

Резкий рост объемов корпоративной информации, наблюдающийся в последнее время, аналитики связывают не только с разработкой новых бизнес-приложений, но и с возникновением крайне ресурсоемких направлений. Среди них лидирующие позиции принадлежат сверхбольшим базам данных в наукоемких отраслях (генетике, медицине, геологии, астрономии и космических исследованиях) и системам обработки медиаконтента (видео, анимация). Кроме того, появление огромных архивов электронной почты, объемных баз данных систем MRP/ERP и CAD/CAM/CAE, других подобных приложений привело к тому, что общий объем хранимой корпоративной информации оценивается сегодня во многие сотни петабайт и постоянно увеличивается.

В таких условиях применение технологии виртуализации ресурсов хранения – единственный выход, позволяющий не только добиться консолидации разрозненных «островков данных», но и отображать практически неограниченное количество разнородных носителей, устройств памяти и систем хранения в виде унитарного хранилища данных (так называемого виртуального пула), управление которым осуществляется централизованно при помощи единого узла доступа.

Виртуализация – это...

Виртуализацию хранения данных можно трактовать настолько по-разному, что многие специалисты так и не пришли к формулировке, предполагающей однозначное толкование как термина, так и самой концепции. Поэтому наиболее точным принято считать определение исследовательской группы IDC, согласно которому под виртуализацией ресурсов хранения подразумевается использование специализированного ПО, упрощающего управление сложными конфигурациями внешней памяти за счет внедрения логических представлений физических ресурсов хранения.

Такое определение предполагает, что при применении технологий виртуализации (с точки зрения пользователя) полностью устраняются связи между серверами и устройствами хранения разных типов, а физическая память преобразуется в единый логический пул, состоящий из отдельных гетерогенных устройств хранения, прозрачный доступ к которым обеспечивается независимо от их технических особенностей и территориального расположения.

А есть ли смысл

Технологии виртуализации ресурсов хранения данных, FalconStor IPStor и немного аналитики
Разрозненные «островки данных» приводят к неэффективному использованию ресурсов, усложнению миграции данных и чрезмерной стоимости управления

Внедрение этих технологий позволяет не только оптимизировать использование имеющихся гетерогенных ресурсов хранения (по оценке компании DataCore Software, экономится до 30% доступного дискового пространства), но и управлять огромными пулами внешней памяти. Значительная выгода достигается также за счет упрощения управления системами хранения, снижения нагрузки и уровня требований, предъявляемых к IT-персоналу, сокращения сроков резервного копирования и восстановления данных, повышения отказоустойчивости всей корпоративной информационной системы.

Как следствие, уменьшается совокупная стоимость владения ею (за счет устранения «островков данных», более эффективного использования уже имеющихся устройств и систем хранения, обеспечения работы с ресурсами хранения в гетерогенной среде, возможности построения корпоративной системы хранения из компонентов различных производителей, оптимальных по цене).

Что предлагает рынок

Существует довольно много продуктов, предназначенных для решения описанной выше задачи. При этом одни компании разрабатывают средства виртуализации самостоятельно, а другие идут по пути ОЕМ-партнерства и приобретения соответствующих технологий (например, Hewlett-Packard, Fujitsu Softek, EMC, Sun Microsystems).

Среди самых распространенных решений для виртуализации ресурсов хранения, уже получивших определенную известность на мировом рынке (или проанонсированных их производителями), следует выделить IPStor (FalconStor Software), SANsymphony (DataCore Software), Softek Virtualization (Fujitsu Softek), Foundation Suite (Veritas Software), TotalStorage Virtualization Family (IBM/Tivoli), Storage Virtualization Engine (Vicom), VersaStor (Hewlett-Packard), Virtual Storage Manager (StorageTek) и Systina VM for Linux (Systina Software).

По прогнозу Gartner Group, к середине 2006 г. объем мирового рынка средств виртуализации ресурсов хранения достигнет 8,6 млрд долл. Таким образом, рынок достаточно перспективен, что не могло не привлечь к нему внимания. Тем не менее крупные компании практически уступили место молодым «участникам регаты», которым и принадлежат наибольшие достижения в этой области. Такая инертность объяснима: технологии виртуализации ресурсов хранения практически устраняют зависимость от аппаратных и программных средств конкретного вендора, что сводит на нет конкурентные преимущества известных производителей.

В качестве примера для рассмотрения мы выбрали IPStor от FalconStor Software, причем неслучайно, ведь будучи весьма мощным набором средств для решения поставленной задачи, этот продукт обладает еще и достаточно демократичной ценой...

IPStor: снаружи и изнутри

Технологии виртуализации ресурсов хранения данных, FalconStor IPStor и немного аналитики
Внедрение виртуализации хранения данных позволяет объединить существующие хранилища в целостную, легко управляемую инфраструктуру

IPStor представляет собой многофункциональное мультикомпонентное ПО виртуализации ресурсов хранения, агрегирования и обеспечения коллективного доступа к сетям накопления данных через инфраструктуры IP/iSCSI, Fibre Channel и SCSI при работе в средах Windows, Linux и Solaris. В числе основных возможностей IPStor – резервное копирование, зеркалирование, репликация, создание мгновенных снимков, передача данных на уровне файлов и блоков по стандартным сетям IP (с реализацией функциональности SAN и NAS – пользователь «видит» ресурсы IPStor как SAN или NAS) и многое другое.

Блочный доступ к ресурсам хранения может осуществляться как через обычную сеть (поверх протокола IP), так и через сеть хранения данных (по протоколу Fibre Channel). Для получения файлового доступа к ресурсам хранения дополнительного ПО не требуется, он предоставляется по протоколам CIFS и NFS.

Важно отметить, что доступ к ресурсам SAN разрешается после регистрации клиента на сервере на основе IP-адреса и пароля. Для аутентификации используется протокол Диффи–Хеллмана. Каждому клиенту может быть назначен любой SAN-ресурс с одним из следующих уровней доступа:

  • «только чтение» – клиент может только читать содержимое ресурса без права записи;
  • «чтение/запись» – читать и записывать содержимое ресурса может только один клиент, всем остальным в доступе будет отказано;
  • «чтение/запись non-exclusive» – несколько клиентов одновременно могут получить право чтения/записи на ресурс, что позволяет обеспечить требуемые условия для кластеров или многопользовательских приложений.

Функциональность IPStor дает возможность решить все основные вопросы, связанные с построением отказоустойчивых компьютерных систем и решений для защиты от катастроф. Выполнение этой задачи обеспечивают такие функции IPStor: зеркалирование, cоздание и ведение множества мгновенных снимков и восстановление с них данных, интеграция с распространенными СУБД и средствами резервного копирования, обеспечение отказоустойчивых соединений, организация кэширования данных. В числе этих функций стоит упомянуть также возможность сохранения/восстановления текущей конфигурации, которая при выходе из строя сервера IPStor (если он работает не в одноименном кластере) допускает его установку на другой компьютер с последующим восстановлением последней сохраненной конфигурации.

Перспективы технологий виртуализации

Очевидно, что появление этих технологий на рынке – не дань моде, а насущная необходимость, вызванная, по сути, неподготовленностью разработчиков к сложившейся ситуации. Бесспорно и наличие массы тормозящих факторов – несогласованность действий большинства производителей, отсутствие установившихся стандартов, недостаточная технологическая завершенность многих идей. Более того, даже уже разработанные технологии довольно сырые, причем в качестве основного минуса упоминается проблема отказа самой системы виртуализации: любой сбой в работе этих устройств приведет к недоступности для пользователей всех ресурсов хранения, так как образуется единая точка отказа. Поэтому в ряде случаев требуется резервирование самих устройств симметричной виртуализации. Кроме того, поскольку все операции ввода/вывода осуществляются непосредственно через устройство симметричной виртуализации, накладываются определенные ограничения на производительность всей системы.

Однако несмотря на эти и другие проблемы прогнозы отраслевых аналитиков единодушны: в ближайшем будущем технологии виртуализации ресурсов хранения будут активно продвигаться во все сегменты рынка – начального, среднего и верхнего уровней. И решающее преимущество в конкурентной борьбе получат компании, чьи программные продукты виртуализации ресурсов хранения уже зарекомендовали себя на мировом рынке.

Три основных типа виртуализации ресурсов хранения

Системная виртуализация обычно реализуется в однородных (гомогенных) системах хранения на уровне RAID-контроллеров дисковых массивов, обеспечивающих создание виртуальных дисков необходимого объема (из общего пула), зеркал и мгновенных снимков (snapshots).

В технологии виртуализации на уровне SAN существуют два основных подхода: симметричная (in-band) и асимметричная виртуализация (out-of-band). При симметричной виртуализации между серверами и модулями хранения помещается специальное устройство, содержащее правила преобразования физических ресурсов хранения в логические ресурсы. Устройство же асимметричной виртуализации подключается непосредственно к серверу или коммутатору/маршрутизатору и управляет передачей информации о данных между приложением и сервером на их пути к устройству хранения, подсоединенному к SAN.

Серверная виртуализация осуществляется с помощью специальных программных средств, установленных на серверах и обеспечивающих прозрачный доступ к данным, находящимся в любом месте корпоративной системы хранения (как через локальные, так и глобальные сети и SAN). Технология серверной виртуализации позволяет работать с архитектурами систем хранения DAS, NAS и SAN.