`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

SSD в малых серверах

+88
голосов

Как правило, администраторов малых серверов приводит в отчаяние не дефицит процессорной мощности, а неспешный дисковый ввод-вывод. Картину проясняет погружение в структуру запросов приложений, анализ типов операций, размеров блоков данных, длин очередей, задержек на дисках. Можно обойтись без погружения: простые и неразорительные способы расшевелить дисковый трафик лежат на поверхности.

SSD активно используются в дорогих серверах операционных приложений и системах хранения данных, где критична производительность дискового ввода-вывода (I/O). А вот в серверах начального уровня SSD до сих пор редкость — хотя они там более чем к месту: приложения типовые, коммерческих данных немного, затраты невелики, эффект налицо.

Дисковая подсистема сервера состоит из контроллера I/O и накопителей, объединенных в RAID-массив. Требования к производительности, емкости и надежности хранения всегда привязаны к конкретному набору серверных приложений. Что отличает покупателей малых серверов — так это повышенное внимание к цене реализации. (Лучше бы смотрели на целесообразность решений). Может, не так считают?

Производительность I/O оценивают параметрами:

  • Скорость устоявшейся передачи данных (sustained transfer rate, MB/s) — объемная характеристика пропускной способности в потоковых операциях;

  • Производительность рандомных операций (random Read/Write, IOPS) — количество отработанных обращений к диску в единицу времени при случайном доступе к данным;

  • Задержка отклика (latency) — время ожидания ответа на запрос ОС.

Их типичные значения для отдельно взятых накопителей такие:

SSD в малых серверах

Диски собирают в RAID-массивы ради производительности I/O, обслуживания больших объемов данных, надежного хранения и восстановления информации при отказах накопителей. Cтратегии RAID сильно изменились c появлением SSD, особенно в малых серверах — где дисков наперечет.

Простой пример. В операциях случайного доступа короткими блоками (как в серверах баз данных) важны задержки отклика и количество обработанных IOPS. Эти параметры взаимосвязаны. В небольших дисковых группах у любых RAID из SAS HDD 15K rpm нет никаких шансов догнать зеркало из двух SSD по этим показателям. С запросами потоковых приложений и потребностями в емкости полностью справляются недорогие SATA HDD 7200 rpm. Вычеркиваем SAS HDD 15K rpm.

Уровни уровням RAID рознь. Взять RAID 5. Он экономно расходует дисковое пространство, но расточителен по вычислительным ресурсам. Кроме того, у него высокие накладные расходы, «штраф» (число выполняемых операций I/O на дисках на одну логическую операцию записи ОС). Для достижения пристойной производительности аппаратному контроллеру с поддержкой RAID 5 (от $400) нужен режим обратной записи на диски (Write back), а значит — защита кэш-памяти, батарейкой или флэш-модулем аварийного сброса данных ($200-250). Такой ценой аппаратные контроллеры RAID 5 в малых серверах точно не нужны.

Отсекая неуместное, приходим к портрету типовой дисковой подсистемы малого сервера: максимум четыре дисковых отсека, один четырехканальный контроллер и не более четырех дисков, SSD и SATA HDD 7200 rpm.

SSD в малых серверах

Разумеется, диски должны быть серверные. Пользователи знают, что HDD RAID-серий построены на другой механической платформе, снабжены аппаратной компенсацией наведенной (соседями по массиву) вибрации и своевременно передают обработку ошибок RAID-контроллеру, предотвращая уход массива в деградированное состояние.

SSD для серверов отличаются от собратьев для ПК еще больше: у них принципиально другие контроллеры, алгоритмы усиления записи (write amplification) и ротации свободных ячеек (garbage collection). Их кэш-память защищена конденсаторными цепями для корректного завершения транзакций при обесточивании, а резерв служебных ячеек (overprovisioning) гарантирует стабильный уровень производительности по мере заполнения диска и большой ресурс перезаписи.

Комбинируя SSD и HDD, можно выжать производительность I/O и набрать необходимую емкость хранения доступными средствами. Каким способом cобирать их в RAID-массивы, зависит от целевых приложений, бюджета, готовности администратора к процедурам аврального восстановления данных.

Примерим цены к целям.

Традиционный метод

Обычно в составе малого сервера покупают 2-4 недорогих SATA HDD 7200 rpm, подключенных к портам SATA 3G/6G материнской платы. На платах есть встроенный RAID, например Intel RST (уровни 0, 1, 10, 5) в чипсетах Intel C222/224/226 под процессоры Xeon E3-1200 v3 в сокете 1150. Этот RAID программный, ему нужны ресурсы центрального процессора и оперативной памяти сервера для расчета контрольных сумм RAID 5, кэширования чтения/записи, управления массивом. Другие минусы программных RAID: зависимость от драйверной поддержки, ограниченная совместимость с ОС, низкая устойчивость к внешним факторам (отключению питания), высокие риски развала массива, трудоемкие процедуры восстановления данных. Зато бесплатно.

SSD в малых серверах

Возможностей 4 дисков SATA 7200 rpm хватает для задач сгона видео, резервного копирования или файлового хранения — приложений с последовательным обращением к данным — где HDD 7200 мало чем уступают SSD. При емкости дисков 2TB бюджет такой дисковой подсистемы составляет 4 x $150 = $600.

Для работы учетных систем ее скорее всего не хватит. По производительности, не по емкости. Пять пользователей небольшой базы данных объемом 200MB создают пиковые нагрузки свыше 500 IOPS, тогда как 4 диска SATA 7200 в RAID 10 больше, чем 200 IOPS не осилят. Хотя средняя нагрузка на дисковую подсистему намного ниже пиковой, именно в критических режимах (фильтрация данных, автоматические загрузки из других систем, проводки за период) проявляется несоответствие сервера задачам и нарастает раздражение пользователей.

Гибридный RAID

Еще когда SSD только начали появляться в серверах, компания Adaptec решила смешать в недорогом RAID-массиве достоинства SSD (высокую скорость считывания) и HDD (низкую цену). С тех пор сменилось три поколения контроллеров, но до сих пор в ходу недорогой Adaptec 6405e с поддержкой RAID 0, 1, 10 и реализацией гибридного RAID. Активизация опции Hybrid RAID на паре SSD/HDD приводит к тому, что контроллер пишет данные на оба устройства, как в традиционном зеркале, но читает данные только с SSD, игнорируя HDD. Скорость считывания — основной козырь SSD, и в этом весь смысл гибрида: читать с быстрого устройства, вместо балансировки чтения между устройствами.

Системам, критичным к производительности записи случайного доступа от гибридов проку мало — низкая скорость записи на HDD сводит на нет преимущества быстрого чтении. Смысл появляется в приложениях с приоритетом чтения. Примеры гибридных решений — в трех сценариях ниже.

Рабочая станция, сервер-читальня

Сегодняшний пользователь рабочей станции хочет быстрой загрузки ОС и приложений, уверенности в сохранности данных и простой процедуры их аварийного восстановления. Растут запросы не только к производительности, но и к объему хранения («препринт-станция», «студия на столе», «библиотека»). Терабайты данных в форме документов, фотографий, видео нужны под рукой, и их нельзя терять.

Берем один SSD 120GB ($150), два HDD 2TB (2 x $150 = $300) и строим средствами контроллера Adaptec 6405e ($250) два зеркала: гибридное (Hybrid RAID из SSD и небольшой части первого HDD), и обычное (из остатка первого HDD и такой же емкости второго HDD). Потратив $700, получаем два массива: один под быстрое чтение, второй под объемное хранение. Небольшой «хвостик» на втором HDD можно отдать под временные файлы.

SSD в малых серверах

Преимущества такой конструкции — в быстром чтении с SSD, намного быстрее, чем с одного HDD (или зеркала из двух HDD). Скорость записи такая же, как у стандартной рабочей станции. Потеря диска не приводит к потере данных, достаточно заменить его на новый и запустить процедуру восстановления данных на контроллере.

Утилизуем все порты контроллера

Предыдущая конфигурация построена на 4-портовом Adaptec 6405e, но трех дисках. Задействовать с пользой все порты можно, добавив еще один SSD 120GB ($150) — под зеркало с тем самым незащищенным фрагментом HDD из примера выше.

SSD в малых серверах

Кажется более логичным объединить в одном зеркале 2 SSD, а во втором 2 HDD — вместо построения двух гибридных массивов. И да, и нет. В серверах с преобладанием чтения SSD в составе гибридных массивов дадут тот же эффект, что и чтение с одного SSD (или зеркала с SSD). Потоковая запись почти не пострадает — SSD и HDD 7200 rpm по этому показателю близки. Если фокус I/O сосредоточен на чтении, два гибридных массива с вдвое большим прежнего (2×120 GB = 240GB) объемом быстрого пространства и почти тем же простором под хранение могут сыграть на руку владельцу объемного контента («веб-витрина», «агрегатор объявлений»).

Три гибридных RAID в одном сервере

Несколько гибридных массивов RAID можно построить, отзеркалив один, два, да хоть три SSD на один и тот же HDD — контроллер 6405e позволяет это сделать. Смысл — в увеличении быстрого пространства под активно считываемые данные («новостной портал», «доска объявлений»), с HDD на подстраховке. Для трех SSD 120GB хватит HDD емкостью 1TB ($100), а бюджет дисковой подсистемы уложится в $800 (3 x $150 + $100 + $250). Того же эффекта можно добиться, взяв один SSD большой емкости вместо трех.

SSD в малых серверах

Используем все преимущества SSD

Гибриды не помогут комфортной работе в приложениях учета и делопроизводства. Там нужна дисковая подсистема, отрабатывающая пиковые нагрузки обращения к дискам без накопления очередей I/O — то есть с высоким уровнем IOPS при стабильно низких задержках обработки запросов (latency). В серверах баз данных одинаково критична производительность и чтения, и записи случайного доступа. Тут возможности SSD несравнимо выше, чем у HDD. Но и об отказе от вращающихся дисков речи нет, достаточно маршрутизировать запросы и потоки данных по разным носителям.

Типичные приложения семейства 1С работают с пятью типами потоков данных I/O. Обращения к таблицам баз данных (DB) и индексным файлам (index) — рандомного типа. Запись временных таблиц (tempDB), протоколов SQL (log)и пользовательских приложений 1С (tmp) — потоковые операции.

Операции случайного доступа переносят на SSD, хватит минимальной емкости — благо базы данных невелики. Потоковые данные размещают на недорогих SATA HDD 7200 rpm, вместе с ОС, приложениями, папками пользователей и архивами. Бюджет остается в скромных рамках: два зеркала (RAID 1) из двух SSD интеловской серии 3500 емкостью 120GB (2 x $150 = $300) и двух HDD 2TB (2 x $150 = $300) обойдутся в те же $600, что при традиционном подходе на четырех HDD. Только теперь это будет сервер без узких мест («универсальный сервер малого предприятия»).

SSD в малых серверах

Подключение всех четырех накопителей к бортовым портам материнской платы в программном RAID не угрожает производительности — ее определяют SSD со своими контроллерами, памятью, средствами защиты и стабильно высокими характеристиками. Пользователям серверов баз данных они удобны еще и потому, что маскируют качество настроек приложения. Купить зеркало из двух серверных SSD дешевле оптимизации программного кода.

Добавляем выделенный контроллер RAID

У аппаратного RAID-контроллера есть собственный процессор, встроенные процедуры и кэш-память для обслуживания выбранного уровня RAID. Списки поддерживаемых ОС у них несравнимо длиннее, чем для программных RAID поверх логики материнских плат. Независимость представления RAID-массива от драйверов и ОС позволяет легко перенести массив на другой физический сервер. Процесс реконструкции массива автоматизирован.

SSD в малых серверах

Малому серверу уровней RAID 0, 1, 10 достаточно. Цена аппаратных контроллеров такого класса, LSI 9211-4i (c прошивкой IR) или Adaptec 6405e не превышает $250. Об уровне их программной поддержки можно судить по ссылке. В сумме с накопителями из предыдущего примера затраты увеличиваются до $850, зато расширяется спектр применения, достигается переносимость массива, упрощается восстановление данных. С таким сервером можно «пройти огонь, воду и медные трубы».

Заключение

Вопреки расхожему мнению «SSD недоступны для малого бизнеса», приведенные сценарии дают мотивы для победы здравого смысла над скупостью. Достаточно понимания целей и общего представления об исполняемых приложениях и нагрузках ввода-вывода.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

+88
голосов

Напечатать Отправить другу

Читайте также

специально полез проверять цены на SSD :-)
и таки да - вполне энтерпрайзные Intel DC S3500 120GB
стоят несущественно дороже сугубо бытовых такой же емкости
(сразу вспомнился STEC на заре SSD-строения с их ~50K USD за 200GB SLC)

по канонам жанра, в финале ожидал какого-нибудь Adaptec maxCache
но там наверно более серьезная ступенька по цене

Здравствуйте, давно не виделись

Жанр малых серверов требует честности, а Гиппократ завещал не вредить :) Посему схему 2 SSD + 2 HDD 7200 считаем боеспособной для большинства пользователей. Ничего лишнего.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT