Вивчивши архітектурні особливості рідинного охолодження, час перейти до загальних рекомендацій з планування успішного впровадження рідинного охолодження (РО) у дата-центрі, націленого на AI-завдання.
З огляду на проблеми з живленням, охолодженням і стійками, які пов'язані з розгортанням робочих навантажень AI, планування фізичної інфраструктури має здійснюватися паралельно з ІТ-плануванням. Завчасне планування знизить ризики виникнення проблем і затримок. Це має бути спільна робота ІТ-відділу та відділу експлуатації. В іншому разі ви вкладете гроші в дуже дороге ІТ-обладнання, а воно залишиться без діла, поки ви розроблятимете план його підтримки. Наведемо рекомендації щодо розв'язання декількох загальних проблем.
Як уникнути затримок під час впровадження AI? Відомі випадки, коли організація купувала кілька серверів NVIDIA DGX, а потім виявлялося, що для їхнього встановлення не вистачає потужності. Такий самий сценарій може статися і з охолодженням. При будуванні нового дата-центру, процес проєктування має враховувати й оптимізувати вимоги до рідинного охолодження. Якщо йдеться про наявні ЦОДи, оцінка майданчика - одна з перших справ, яку має зробити ваша команда, щоб виявити ризики для графіка розгортання AI.
Перш за все необхідно переконатися, що ваша система охолодження має достатню резервну потужність для підтримки запланованих серверів. Визначте, чи є у вашого джерела безперебійного живлення резервна потужність для підтримки помп блоків розподілу холоду (БРХ). Втрата охолодження може призвести до зупинки сервера або, що ще гірше, до пошкодження мікросхем. Важливо розібратися в резервних компонентах вашої холодильної установки. Наявність резервних компонентів робить розгортання менш руйнівним для наявних критичних навантажень.
Визначте, чи потрібна вам холодильна установка. Якщо її немає, розгортання системи рідинного охолодження стає менш реалістичним у міру збільшення кількості серверів із рідинним охолодженням. Також визначте, чи може чиллерна установка забезпечувати температуру води, сумісну як з повітряним, так і з рідинним охолодженням ІТ-обладнання. Зверніть увагу, якщо у вас є режим економайзера, перевірте, чи сумісний він із пропонованою температурою охолодженої води. Оцініть, чи може система управління інфраструктурою центру обробки даних (DCIM) контролювати систему рідинного охолодження, включно з виявленням витоків. Якщо у вас немає системи DCIM, слід розглянути можливість її впровадження. Переконайтеся, що обладнання для розподілу охолодження входить до списку схвалених виробниками серверів і не порушує гарантійну політику. Сюди входять колектори, трубопроводи від колектора до сервера, з'єднувачі, регулювальні клапани, помпи та блоки БРХ.
Щодо структурних міркувань, перевірте, чи достатньо у вас вільного простору під стелею для встановлення повітряного захисту навколо кластера стійок AI. Це зменшить імовірність виникнення гарячих точок і підвищить ефективність. Переконайтеся, що перекриття або фальш-підлога дата-центру розраховані на вагу пропонованих стійок AI. Були реальні випадки, коли дорогі навчальні стійки AI провалювалися крізь підлогу, яка не була розрахована належним чином.
Цілком імовірно, що співробітники вашого дата-центру не мають безпосереднього досвіду роботи з блоками БРХ і розподілом води по серверах з рідинним охолодженням. Але в них має бути досвід роботи з чиллерними установками, що дасть їм хорошу основу для накопичення знань. Використовуйте екосистему кваліфікованих партнерів для створення цієї основи. Постачальники, які розробляють і виробляють блоки БРХ, розуміють усю складність рідинного охолодження і можуть допомогти знизити ризики. Коли справа доходить до встановлення, постачальники також повинні мати список рекомендованих монтажників різних спеціальностей, які розбираються в цих системах.
Перехід на рідинне охолодження в центрах обробки даних — це комплексний процес. При цьому дуже важливо ознайомити ваші бізнес-команди із технологією. Це допоможе вашій організації брати участь у дискусіях про рідинне охолодження та ухвалювати обґрунтовані рішення. AI та технології рідинного охолодження швидко розвиваються, тому будьте в курсі подій.
Вкрай важливо тісно співпрацювати з технологічними партнерами, включно з ІТ-постачальниками, фахівцями з охолодження, системними інтеграторами та партнерами з обслуговування. Вони допоможуть спланувати, спроєктувати, впровадити та підтримувати архітектуру рідинного охолодження відповідно до ваших загальних та операційних цілей.
Рідинне охолодження стійок AI високої щільності є більш енергоефективним, ніж традиційне повітряне охолодження. Порівняйте конкретні системи, які ви обираєте (наприклад, БРХ), з вашими цільовими стандартами енергоспоживання та стійкості, якщо це може бути застосовано. Тісна інтеграція систем керування дає змогу автоматизувати температурний режим для подальшого зниження енергоспоживання. Програмний моніторинг, управління та звітність також допомагають центру обробки даних відстежувати енергоспоживання й ефективність охолодження в режимі реального часу, що дає змогу вносити корективи для подальшої оптимізації та забезпечення відповідності стандартам стійкості та нормативним вимогам. Немає потреби йти на компроміс із цілями сталого розвитку; рідинне охолодження може зменшити вуглецевий слід і підтримати загальні цілі сталого розвитку.
Комп’ютерний розум: генеративний штучний інтелект у рішеннях AWS