Сетевые устройства хранения данных класса NAS можно смело называть «чернорабочими» современных сетей – они не блещут производительностью, не выполняют парадных приложений, на их долю выпадают самые рутинные и второстепенные процедуры жизнеобеспечения сети. Зато их клиентами является вся сеть, а не ее избранные представители. Их работа состоит из множества повседневных операций, которые не замечаешь, как и привычный комфорт – пока он есть. Ценить коммунальные сетевые службы начинаешь, только когда потеряешь этот комфорт, вместе с важными данными.
Рассматриваемые нами NAS-серверы произошли от файловых. Службы управления файлами не требуют полноценной сетевой ОС, зато чувствительны к доступности информации. Со временем последние трансформировались в специализированные сетевые устройства с дисками большого объема для хранения данных клиентов сети с необходимым уровнем качества. Их основной задачей стали поддержка приложений, работающих с файловыми протоколами, и обеспечение средств защиты общих данных. Потребности компаний росли, с ними росли объемы важной и второстепенной сетевой информации, которой требовалось дисковое пространство. Задачу экономного управления этим многодисковым многопользовательским хозяйством возложили на серверы NAS.
Применение специализированных устройств NAS в информационной системе предприятия позволяет:
Работа NAS-сервера состоит из набора служебных операций над данными и их носителями. Часть служб отвечает за «самосохранение» сервера, часть – за управление им, остальные обеспечивают пользовательские сервисы, доступные клиентам сети в соответствии с их правами и квотами. Рассмотрим службы по группам: аппаратные ресурсы обеспечения отказоустойчивости и производительности; ресурсы управления настройками и работой сервера; пользовательские сервисы.
NAS, по-сути, является устройством, построенным на стандартной серверной компонентной базе, и в нем могут быть реализованы все типовые механизмы обеспечения производительности и отказоустойчивости. Коль скоро NAS-системы не обслуживают критичных приложений, надежность хранения здесь достигается разумным уровнем дублирования компонентов с использованием интеллектуальных алгоритмов восстановления информации и защиты от сбоев. Жесткие диски NAS-серверов объединяются в RAID-массивы, обслуживаемые аппаратными RAID-контроллерами, где есть собственный процессор, логика и объемный кэш-буфер. В отличие от серверов баз данных файловые операции не так чувствительны к задержкам доступа к поверхности дисков и скорости перехода между блоками данных. Поэтому стандартно в NAS применяются SATA-накопители, менее скоростные, чем SAS, но куда более емкие и дешевые. С точки зрения надежности и быстродействия критичен как раз выбор RAID-контроллера с его диапазоном поддерживаемых уровней RAID и функций скорейшего восстановления работоспособности (например, hot spare – см. Словарь NAS). Комплектация контроллера аккумуляторной батареей позволяет сохранять данные в кэш-памяти в случае перебоев энергоснабжения, а возможное при этом включение кэширования операций записи дает серьезный прирост производительности. Качественные контроллеры отличает корректная драйверная поддержка со стороны ОС.
Большинство NAS оснащается избыточной системой питания, применяется также производительное охлаждение с дублированными элементами. Горячее резервирование жестких дисков, блоков питания и вентиляторов позволяет произвести замену отказавших запчастей без остановки сервера, а эффективные алгоритмы восстановления RAID-массива после сбоя диска – минимизировать время работы массива в деградированном состоянии.
В сетевом дисковом массиве обязательно наличие как минимум двух сетевых адаптеров GbE, способных работать в режиме агрегации каналов (link aggregation, trunking), когда несколько физических каналов объединяются в один логический. При этом увеличивается не только пропускная способность отрезка сети между коммутатором и дисковым массивом пропорционально суммарным возможностям сетевых адаптеров, но и надежность. В случае отказа какого-либо адаптера трафик перенаправляется на следующий работающий без прерывания сервиса. Поддержка сетевыми адаптерами технологии укрупненной пакетной передачи данных Jumbo frame позволяет существенно повысить их пропускную способность и снизить загрузку центрального процессора.
С удешевлением оборудования 10 Gb Ethernet в NAS-системы все чаще устанавливают специализированные сетевые адаптеры с поддержкой функции TCP Offload Engine (TOE). Суть технологии сводится к обработке команд стека TCP не средствами центрального процессора, а непосредственно сетевым адаптером. Применение последних расширяет возможности сетевых массивов с использованием протокола iSCSI в составе кластера серверов или сети хранения данных IP SAN.
Жесткие диски отказоустойчивых систем хранения данных всегда объединяются в RAID-массив. В приложениях, критичных к производительности и времени наработки на отказ, используют накопители стандартов FC, SAS, SCSI. Для решений с другими приоритетами – как, например, NAS – подходят диски SATA, но не все.
Выпускаются специальные серии для RAID, и маркируются они иначе, чем продукты для обычных ПК. К примеру, у Seagate – это индекс NS (Network Storage), у Western Digital – RE (RAID Edition) и т. д. Их цена на 20–30% выше аналогичных по емкости десктопных моделей тех же вендоров.
Конструктивно это одни и те же накопители, зато с точки зрения электроники и прошивок (firmware) – принципиально разные. Основное отличие состоит в механизме отклика на запросы контроллера при ошибках диска. В случае десктопного HDD силами контроллера и самого накопителя будут предприняты попытки переноса информации сбойного участка на резервное рабочее место. При неудаче, по тайм-ауту (а это секунды), HDD перестает существовать для контроллера, массив переводится в деградированное состояние и начинается многочасовой процесс восстановления. Разумеется, в ущерб выполнению основных задач. Иное дело с RAID-сериями. Их прошивки подразумевают, что диск работает в составе массива и ни при каких обстоятельствах не может быть потерян контроллером. Процесс восстановления проходит с участием резервов поверхности сбойного диска, с переадресацией контрольных сумм и данных остальных накопителей массива.
Еще одна особенность дисков RAID-серий – возможность отключения кэширования на запись. Это делается для сохранности данных при отключении питания. За неоконченные транзакции в таком случае отвечают RAID-контроллер и его кэш-память. Включение кэширования записи на контроллере увеличивает быстродействие дисковых операций, но безопасной такая работа будет только при наличии у него аккумуляторной батареи резервного питания (Battery Backup Unit, BBU).
Диски RAID-серий проходят у вендоров обязательную калибровку (выравнивание характеристик) и, как правило, снабжаются специализированными прошивками, позволяющими добиваться прироста быстродействия в проверенных конфигурациях. Например, Hitachi использует технологию RVS (Rotational Vibration Safeguard) для борьбы с ошибками позиционирования головок под влиянием вибрации соседних дисков. По утверждению компании, это дает увеличение производительности массивов до 37%.
NAS-системы администрируются на уровне ОС, специализированного ПО и веб-интерфейса. Управляя конфигурацией RAID-массива, добиваются гибкого разбиения доступного пространства (multiple RAID selection, array roaming, online RAID level/stripe size migration, online RAID capacity expansion), проводят профилактические и восстановительные процедуры (background initialization, drive insertion, hotspare), в кратчайшие сроки изолируя сбои и восстанавливая штатное быстродействие, уровень доступности и резервирования данных. Создание виртуальных дисков поверх группы физических (Disk group, Virtual disk, Redundant Storage Set) дает возможность оптимизировать быстродействие массива, снизить вероятность критических сбоев в работе и риск потери информации, существенно упрощает управление и доступность данных в целом.
Использование средств удаленного управления NAS позволяет администратору дистанционно, через веб-интерфейс включать/выключать сервер, отслеживать загрузку BIOS и ОС, перезагружать NAS с сохранением уже установленной связи, тем самым непрерывно контролируя работу. Инструменты удаленного управления значительно упрощают первоначальную настройку и восстановление функциональности, одновременно снижая совокупные затраты на сопровождение и администрирование. Системный администратор посчитает ценными такие функции, как оповещение об угрозах работоспособности и изменении настроек оборудования и ПО, журнал событий, возможность установки и обновления ПО без непосредственного подключения к серверу. Системы удаленного управления NAS в минимальном наборе поддерживают функцию Serial over LAN, предоставляют интерфейс командной строки и защищенное соединение. В более развитых системах встречаются поддержка полноценного KVM-over-IP, протоколов IPMI 2.0 (Intelligent Platform Management Interface), SMASH CLP, система управления WS-Management, реализован встроенный веб-сервер со страницами диагностики и управления, есть многоязыковые интерфейсы.
Вообще говоря, будет не совсем верно назвать пользовательскими большинство сервисов систем NAS. Регулярные процедуры в сети отрабатываются службами, ответственными за сохранность информации, вовсе не по желанию клиентов, а скорее для предупреждения угроз потери данных, умышленно или по неосторожности.
К сервисам NAS в первую очередь необходимо отнести подсистемы обеспечения сохранности данных. Это может быть локальная (snapshot, snapclone, mirrorclone) либо удаленная репликации (однонаправленная или двунаправленная, синхронный и асинхронный режимы) – создание образа исходных данных на другой системе/узле через локальную сеть.
Важной особенностью NAS является способность поддерживать разнородные подключения (heterogeneous connect). В NAS реализована поддержка различных сетевых клиентов (Windows, Linux, UNIX, Mac OS, Terminal station) с помощью стандартизированных файловых протоколов обмена (SMB/GIFS, NFS, FTP, Secure FTP, Apple Talk, HTTP). Наряду со способностью обеспечивать, в том числе в режиме кластеризации, «единую точку входа» (SIS) доступа к данным для всех пользователей сети, такая универсальность NAS позволяет предоставить прозрачный, независимый от платформы, гарантированный доступ к коммерческим данным организации. При этом всегда следует обращать внимание на то, как в управляющем ПО реализована интеграция с Active Directory.
С целью более эффективного использования дискового пространства в NAS реализованы такие важные функции, как фильтрация содержания (content filtering) и квотирование (quota management). Первая из них позволяет разграничить доступ к массиву на запись и чтение по типам файлов. Администраторы же имеют возможность четко определить, какие типы файлов в каких разделах и на каких устройствах будут храниться. К примеру, можно ограничивать типы файлов, к которым обеспечивается совместный доступ, лишь форматами офисных пакетов и исключить хранение MРЗ и AVI. Квотирование позволяет ввести ограничение на объем информации, хранящейся на томе или в области данных, как для клиентов, так и для тома в целом. Квотирование дисциплинирует пользователей и предохраняет том от исчерпания дискового пространства.
Дисковые массивы NAS, как и любые специализированные системы, имеют сферу предпочтительного применения, в которой соблюдается баланс интересов функциональности и цены. Рассмотрим это с точки зрения достижения общих целей организации.
Производительность. В наибольшей степени для NAS она ограничивается внешними интерфейсами и типами протоколов. Соединения 1...10 GbE, даже с агрегацией каналов, сталкиваются с технологическим ограничением по обработке пакетов TCP. Длина пакета 1518 или до 9018 байтов в режиме Jumbo Frame. При этом необходимо обработать каждый из них. Учитывая такие накладные расходы, NAS c iSCSI, пусть и с аппаратным ускорителем стека TCP, только до некоторого предела могут конкурировать с FC SAN, но с ростом нагрузки затраты на решение на Fiber Channel будут меньше, а производительность – выше. В случае использования NAS c iSCSI есть возможность подключения почтового сервера Exchange или базы данных небольшой организации, но в нагруженных корпоративных решениях альтернативой FC SAN они пока не являются. В то же время NAS на сходной аппаратной платформе будет заведомо быстрее (на 15–20%) обычного сервера с неспециализированной ОС.
Функциональность. С этой точки зрения устройства NAS иначе как уникальными назвать сложно. Они работают в гетерогенных средах, практически на любом сетевом протоколе, легко интегрируются в любую IT-среду и способны обеспечивать как файловый, так и блочный доступ (при добавлении функций iSCSI) к дисковому пространству. Их можно объединять в отказоустойчивый кластер и обеспечивать единую точку доступа к данным для всех потребителей. Поддерживаются квоты, разграничение прав доступа и ограничения на контент. Администраторы получают информацию о нарушениях и об исчерпании дискового пространства. При этом конечному пользователю предоставляются такие высокоуровневые сервисы, как доступ к snapshot-копиям, интеграция с Windows Active Directory, поддержка SharePoint Services для совместной работы с документами, сервис печати, работа UPS, антивирусная защита.
Управляемость. В NAS управляемость реализуется на нескольких уровнях. На аппаратном специализированная плата удаленного управления контролирует параметры системы, частоту вращения вентиляторов и температуру в различных блоках, процессы запуска и перезапуска, обеспечивает функции KVM-over-IP и веб-интерфейс. На следующем уровне находятся средства объединения с внешней IT-средой, зависящие от операционной системы – интеграция с AD, права доступа, квоты, Print Management Console и расширенная консоль управления ММС. На еще более высоком уровне – средства управления системой, доступом, квотами и контентом через интерфейс встроенного веб-сервера, генерация отчетов об использовании ресурсов дискового массива. Такая иерархия позволяет четко распределить обязанности между различными группами администраторов и оптимизировать инструменты управления.
Надежность и время простоя. NAS имеет средства локальной (Snapshot, Snapclone, Mirrorclone, ShadowCopy) и глобальной (Clustering, Mirrorclone, ShadowCopy) репликации, построен с использованием дублирующих устройств в критичных к отказам подсистемах. Надежность хранения в IT-инфраструктуре с применением NAS существенно выше, чем в случае обычных файл-серверов и присоединенных массивов DAS, а допустимое время простоя сравнимо с показателями сетей SAN.
Безопасность, консолидация данных. Безопасность хранения данных непосредственно связана с их консолидацией и виртуализацией. Централизованные коммерческие данные проще в обслуживании и контроле доступа. Это касается не только корпоративных БД, почтовых систем и файлов, но и архивов систем видеонаблюдения и разграничения доступа. С использованием специализированных ОС серверы NAS менее подвержены сетевым атакам, а различные антивирусные пакеты позволяют организовать полный контроль всех файловых операций.
Ввод устройств NAS в инфраструктуру предприятий – важный шаг в изменении аппаратно-ориентированного подхода построения IT-сред на сервис-ориентированный. Пользователя не должно интересовать, где и как хранится информация и что скрыто за гарантированным, быстрым, не зависящим от устройства доступом к данным. Для их владельца становится все равно, где физически они находятся – в серверной комнате собственного здания, в ЦОД провайдера или вообще в другой стране. Применение TCP/IP дает широкие возможности для обеспечения сохранности данных и защиты от их изъятия вместе с устройством в результате рейдерской атаки. Для администратора – это полная свобода в выборе инструментов, высокая надежность, информативность средств управления и контроля при одновременном снижении затрат на сопровождение.
Задача | Сервис | Механизм реализации |
Восстановление данных из старых копий файлов | Windows Snapshot | Пользователь сам, без обращения к администратору, восстанавливает удаленные файлы или получает доступ к предыдущим, «затертым» версиям файла |
Multi-Snapshot | Администратор получает доступ к целому ряду мгновенных снимков (4–256), сделанных подряд | |
Создание резервных копий данных | Snapshot, Snapclone, Mirrorclone, ShadowCopy, clustering | Через локальную сеть создается образ исходных данных на другом томе, другой системе/узле |
Обслуживание клиентов различных ОС | Разнородное подключение (heterogeneous connect) | В ПО NAS-серверов включают поддержку стандартизированных файловых протоколов различных сетевых клиентов |
Масштабирование безопасности хранения данных | Кластеризация | Распараллеливание информации на два и более дисковых массива обеспечивает непрерывный доступ к данным в случае выхода из строя одного из массивов |
Разграничение доступа пользователей по типам файлов | Фильтрация содержания | Администратор вводит для различных групп пользователей ограничения по типам файлов совместного доступа |
Разграничение доступа пользователей по объему хранимой информации | Квотирование | Ограничение на объем данных, хранящихся на томе или в области данных, предохраняющее от переполнения дискового объема |
Управление через Веб | Веб-интерфейс мониторинга и управления массивом | Доступ к основным параметрам из любого веб-браузера, администрирование массива, получение отчетности |
Интеграция в IT-инфраструктуру | AD, MMC, PMC | Используются единые для всей сети, ОС-зависимые средства интеграции |
Дистанционное управление аппаратными ресурсами сервера | Инструменты удаленного управления | Включение сервера, контроль параметров, изменение настроек сервера и обновление ПО через веб-интерфейс |
Автоматизация операций с жесткими дисками в массиве | Background initialization, Drive insertion /removal detection and rebuilding | Автоматическое определение вышедших из строя дисков, отключение, переподключение вновь установленных |
Модификация дискового массива | Online RAID capacity expansion, RAID level migration, Multiple RAID selection, Online RAID level/stripe size migration | Реконфигурируя массив, можно изменить его тип, объем, объем томов |
Расширение полосы пропускания данных в сети | Link aggregation, Jumbo frames | Надежность и пропускная способность отрезка сети между коммутатором и массивом увеличиваются за счет агрегации каналов и использования больших пакетов |
Cохранность данных на дисках | RAID-массив накопителей | RAID-контроллер обеспечивает размещение и восстановление данных на дисках массива в соответствии с выбранным уровнем RAID |
Доступность данных | Обеспечение отказоустойчивости оборудования | Диски объединяются в RAID-массив, сетевые порты агрегируются, дублируются источники питания и элементы охлаждения |
Красным – аппаратные ресурсы; желтым – ресурсы управления; зеленым – пользовательские сервисы. |