`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

«Мягкое» и «твердое» в хранении данных

+44
голоса

В инфраструктуре ответственных приложений уменьшается зависимость от физической реализации устройств. Дело идет к слиянию вычислительных модулей и систем хранения данных в одном обличье: ординарных серверов с локальными дисками под управлением конвергентной программной среды.

В тренде

Несколько лет подряд одним из основных ИТ-трендов называют программно-определяемые системы (SDS, Software Defined Systems): серверы, СХД, сети, вплоть до дата-центров целиком. Программируемые системы хранения (тоже SDS, Software Defined Storage) подтачивают рынок традиционных СХД и больше не нуждаются в специализированных устройствах. Программно-определяемой инфраструктурой SDS можно считать объединение вычислительных ресурсов и ресурсов хранения в едином конвергентном решении, которое расширяется более-менее однородными блоками на основе серверов стандартной компоновки (off-the-shelf). Производительность и емкость масштабируются добавлением новых блоков, без внесения изменений в логику управления.

SDS противопоставляют SAN — централизованной инфраструктуре, где серверы, сети и системы хранения данных представлены отдельными сущностями, со своей архитектурой, свойствами, ограничениями, управлением и обслуживанием.

«Мягкое» и «твердое» в хранении данных

SDS как распределенная конвергентная среда исполнения приложений и обслуживания хранения устанавливается поверх кластера серверов с локальными дисками, презентует место на них гипервизорам, контролирует операции чтения и записи, обеспечивает целостность данных и резервирует их для защиты от выхода из строя диска или узла — репликацией на другие узлы.

«Мягкое» и «твердое» в хранении данных

Маятник ценностей

В моде на SDS можно увидеть частное проявление эффекта маятника в споре централизованных и распределенных систем («как будто жизнь качнется вправо, качнувшись влево»). А можно — естественную эволюцию ИТ-окружения.

Абстрагирование от аппаратной реализации серверов было первым посылом виртуализации. Переформатирование и уплотнение вычислительной среды привело к физическому разделению вычислительных ресурсов и ресурсов хранения. При всех выгодах переносимости рабочего окружения и рационального использования мощностей серверов, теперь уже выделенные СХД стали самым критичным местом инфраструктуры, а организация скоростного доступа к данным — болезненной проблемой для многих классов приложений.

С ростом объемов хранения и усложнением движения данных в их жизненном цикле системы хранения стали доминантой инфраструктуры, наиболее ответственной и капиталоемкой инвестицией, консервативной и чрезвычайно обязывающей. Подсистема ввода-вывода серверов, сеть и СХД — потенциально узкие места любой SAN.

Вообще говоря, стабильному бизнесу не так важно, как именно устроена базовая инфраструктура — лишь бы отвечала нагрузкам. При высокой же динамике перемен привязка к косным программно-аппаратным реализациям становится преградой развитию.

Альтернатива есть. В единстве и борьбе hardware/software «твердые» ценности размываются двумя «мягкими» мотиваторами: быстрым развитием ПО и его переносимостью. Им помогает демотиватор «продуктового рабства»: пользователей тяготит зависимость от специализированных (проприетарных) устройств, слишком дорогих для того, чтобы часто обновлять их под меняющиеся требования.

На новом витке развития программных средств управления хранением консолидированные СХД стали вытесняться распределенными системами — с необходимым уровнем абстракции, высокой управляемостью и предельно возможной производительностью. Пример таких движущих сил SDS как Google, Amazon, Facebook заставил пересмотреть стратегию развития даже рядовые дата-центры: производительность, простая архитектура, лучшая управляемость, оптимизация капитальных и операционных затрат, адаптируемость под приложения, упрощение и удешевление сервисной модели нужны всем.

Любое проприетарное устройство является сочетанием оригинального ПО с универсальной технологической базой. Как только логика работы ПО отстраняется от физических форм реализации, исчезает привязка к поставщикам устройств. И тогда специфика приложений пользователя подводит его к выбору между поставщиками ПО, (как правило) не связывая жесткими аппаратными ограничениями: «мягкое» отдельно, «твердое» отдельно. Расщепляемая таким образом модель модернизации инфраструктуры — совсем другая по экономике, подходам и возможностям.

Принципы и козыри SDS

Говоря о конвергентных системах хранения, подразумевают максимальное приближение данных к приложениям-источникам запросов ввода/вывода. Приложения, исполняемые в виртуальных контейнерах, обращаются к виртуальным контейнерам с данными. Где именно и как именно хранятся данные — зависит от конкретного программного продукта SDS. Хранение всегда многослойное, с раздельным размещением горячих и холодных данные на разноскоростных носителях. Среда управления запросами автоматически подстраивает профили хранения под трафик данных с помощью миграции и/или кэширования — для снижения задержек обращения к ним. Дублирование узлов и развитые средства репликации данных делают инфраструктуру устойчивой к отказам узлов и отдельных накопителей.

Перенос программно-определяемыми хранилищами функционала устройств хранения на вычислительные узлы, поближе к данным, обеспечивает балансировку нагрузки, уменьшение потоков операционных задач, повышение реактивности на запросы. Букету сервисов программно-определяемых систем — репликациям, снимкам данных, шифрованию, дедупликации, динамическому расширению томов и т.д. — позавидуют владельцы Mid-range СХД, не говоря уже о системах начального уровня. Скорость изменения ПО с обогащением функциональными возможностями дает владельцу открытых систем дополнительный гандикап.

От СХД в серверной инфраструктуре всегда требуется одно и то же: производительность, доступность данных, масштабируемость. Вcе козыри SDS являются следствием того, что для управления ресурсами хранения используется распределенная файловая система. Она контролирует операции чтения и записи данных, гарантирует целостность данных и резервирует их для защиты от выхода из строя диска или узла.

Производительность

«Мягкое» и «твердое» в хранении данных

Высокая производительность операций ввода/вывода данных (низкие задержки обращения и большие показатели IOPS) достигается тем, что активные данные хранятся локально, либо максимально «близко» к использующей их VM. Задержки по чтению могут быть вызваны перемещением виртуальной машины — и тогда данные запрашиваются с других узлов, пока не будет создана полная локальная копия виртуальной машины. Каждый гипервизор имеет свой контроллер виртуальных машин и минимизирует задержки на передачу данных по сети. «Горячие» блоки кэшируются в оперативной памяти и на SSD. Далее данные распределяются между SATA HDD и SSD или перемещаются между ними — если реализован тиринг, по результатам анализа частоты запросов к блокам данных. Сопутствующие сервисы — как дедупликация данных и онлайн-компрессия — помогают снижать нагрузку на сеть передачи данных и устройства хранения.

Доступность и масштабирование

Защиту данных и метаданных обеспечивает синхронная и асинхронная репликация между узлами, снимки томов и встроенные системы бэкапа. Как именно — зависит от реализации SDS.

Узлы в распределенную инфраструктуру добавляют по необходимости. Не нужно переплачивать за перспективу роста, покупая на старте мощную СХД, не нужно принимать решение о топологии сетей, которое может оказаться ошибочным. Дополнительные капитальные затраты сводятся к закупкам серверов и программных лицензий. При этом лицензии не привязаны к физическим серверам (у большинства поставщиков), их можно переносить со старых на докупаемые устройства, оптимизируя утилизацию серверного парка. Масштабирование через пошаговое расширение распределенной инфраструктуры добавлением серверов стандартной компоновки и покупкой дополнительных лицензий (у кого на объем хранения, у кого — на узлы) прогнозируемо и легко просчитывается. В традиционных SAN, помимо покупки новых серверов, приходится менять СХД на более современную или старшую модель.

Джокер SDS

SDS отделяют функции и сервисы от аппаратного обеспечения. Пользователь вправе наращивать инфраструктуру вверх и вширь, докупать новые или включать в оборот данных унаследованные устройства, выбирать наиболее подходящего поставщика устройств под каждый класс задач. Всеядность SDS к исполнению серверов и переносимость ПО развязывают владельцам руки в модернизации инфраструктуры с использованием самых актуальных инструментов достижения целей.

Отдельных слов заслуживает техническое сопровождение. Владелец SAN-инфраструктуры привязан к условиям сервисных контрактов поставщиков аппаратных устройств: серверов, сетей, СХД. Отказ любого из элементов приводит к простоям. Выход из строя СХД парализует работу компании (или требует дополнительных вложений в подпорное оборудование). Ремонт или замена проприетарных устройств — это всегда дорого и долго. В SDS-модели серверы стандартные, привязки ПО к оборудованию, как правило, нет, выход из строя серверов не приводит к фатальным последствиям, сервис по стандартным комплектующим всегда проще и дешевле. Онлайн-поддержку ПО оказывает его разработчик.

Реализации SDS

Реализации программно-определяемого хранения отличаются управляющей надстройкой, средствами интеграции с программной средой исполнения приложений, сервисными возможностями, моделью лицензирования.

Требований к однородности добавляемых серверов, как правило, нет (хотя некоторые поставщики, пример тому Nutanix, поставляют системы в виде программно-аппаратных строительных блоков — то есть, предопределенного дизайна). Некоторые продукты привязаны к единой операционной среде (как VMware vSAN к vSphere), другие (как Microsoft Server 2012R2) — сами по себе являются ОС, файловой системой и менеджером логических томов хранения. Автономные продукты (как EMC Scale IO или DataCore SANsymphony-V) интегрируются с различными средами виртуализации, вычислительными ресурсами и типами подключения.

VMware vSAN, Nutanix, EMC Scale IO, DataCore SANsymphony-V и многие другие SDS устанавливаются на вычислительные узлы (от трех и больше) с локальными дисками. Подсистема хранения каждого сервера включает минимум два уровня: «горячие» данные хранятся/кэшируются на SSD, основную емкость обеспечивают HDD большого объема. Данные, метаданные, приложения дублированы на нескольких узлах кластера, перемещение наиболее востребованных данных на ближайший к потребителю узел (он же и вычислительный) производится автоматически. Перемещение между слоями хранения у всех реализовано по-разному, не всегда автоматически, но логика всегда одна: класть «горячие» данные поближе к источникам запросов, на быстрые носители.

«Мягкое» и «твердое» в хранении данных

Microsoft Windows Server 2012R2 со встроенной технологией Storage Spaces или Nexenta, построенная на ZFS, работают с программно-управляемыми виртуальными дисковыми пулами. Для хранения данных в кластеризованной среде организуются контейнеры с дисками общего доступа (чаще всего по SAS, но возможны и другие варианты). К ним обращаются узлы кластера, имея возможность распределять нагрузку между собой. Поддерживается многоуровневое хранение данных на емких HDD с кэшированием/тирингом в SSD, иногда — в RAM. В таком решении каждый из узлов может работать как сервис доступа к хранилищу, в том числе в VM, и на этом же узле могут быть запущены другие VM с ролями серверов приложений. Инфраструктура масштабируется добавлением серверов и дисковых контейнеров прямого разделяемого доступа.

«Мягкое» и «твердое» в хранении данных

Каждому свое

Конвергентные решения проникают во все сегменты корпоративного рынка, при этом монополию лидеров размывает множество новых игроков. В Tier 1 (как по уровню задач, так и по ценнику) активно работает VMware — последовательный локомотив программных решений. Дата-центры внедряют ее технологии распределенного хранения vSAN поверх платформы виртуализации vSphere. С точки зрения VMware, ближайшее будущее — за платформой EVO:RAIL гипер-конвергенции «всего» (серверов, сетей, хранения).

Продуктивность игроков второго эшелона и новичков привлекла к SDS внимание многолетних лидеров серверостроения. Вендоры оборудования Tier 1 предусмотрительно выходят на новый для них рынок, спеша разобрать невест. Приметой последних лет стали поглощения малоизвестных софтверных компаний и стратегические альянсы с ними.

EMC покупает стартап Scale IO полутора лет от роду. Компания, контролирующая 25-30% рынка классических СХД, сегодня выходит играть на соседнее поле: серверных сетей хранения данных, объединяющих исключительно программными средствами вычислительные ресурсы и ресурсы хранения в эластичную инфраструктуру.

Один из пионеров SDS, Nutanix, пяти лет от роду, заключает ОЕМ-соглашение с Dell о поставках устройств конвергентной инфраструктуры на базе ее веб-масштабируемых технологий.

Cisco защищает свои инвестиции в дата-центры заключением контракта с DataCore, добавляя возможности программного определяемого продуктом SANsymphony-V хранения к своим серверам унифицированных вычислений Cisco UCS.

Пока идут слияния и поглощения в верхних слоях, дорогой SDS уверенно продвигается Microsoft. От версии к версии ее базовая серверная ОС обрастает функциональными возможностями по управлению логическими томами средствами распределенной файловой системы. Уже сегодня на одних только программных продуктах Microsoft можно построить дата-центр из десятков вычислительных нод с распределенным хранением. Средств WS 2012R2 достаточно для развертывания отказоустойчивой инфраструктуры приложений SMB-предприятия или филиала корпорации. Cкорое появление распределенных хранилищ и развитых средств репликации кластерных томов обещает Microsoft серьезное расширение целевой аудитории. Это уже не подкоп, это разработка корпоративного ландшафта промышленным карьерным способом.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

+44
голоса

Напечатать Отправить другу

Читайте также

ну, я бы не стал противопоставлять SDS SAN. Совсем разного уровня/предназначения технологии.

В остальном автору респект за просветительскую активность :)

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT