`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Примірочна прогресу

Щойно презентоване покоління серверних процесорів AMD EPYC 9004 під кодовою назвою Genoa підтримує DDR5 та PCIe 5, стеля по ядрах на сокет стала вищою на 50% проти попередника Milan – до 96, в півтора раза побільшало каналів пам'яті. Genoa (а також наступне покоління Bergamo зі 128 ядрами на сокет, заплановане на середину 2023) – це відповідь AMD на загрозу серверних процесорів Arm. Але, що добре гiперскейлерам, то зайве у локальних центрах обробки даних. Багато клієнтів не впровадять нові платформи – вони надмірні і як наслідок дорогі.

У продуктивності завжди є інший бік – ціна продуктивності. Наприклад, пам'ять DDR5 конструктивно складніша, ніж DDR4, на ній є управління живленням. Це, а також перехід на нове виробниче покоління, означає, що ціни DDR5 набагато вищі. Для Genoa кожен DIMM коштує на 50%+ більше, ніж у Milan з DDR4. Якщо заповняти всі 12 каналів пам'яті проти 8 у Milan, буде ще дорожче.

Можливо, найбільша різниця між цим запуском та попередніми зводиться до позиціювання. AMD не пропонує єдиний дизайн для всього ринку та не закликає переходити на нову платформу геть усіх. Натомість AMD матиме сегментні рішення. Багато клієнтів залишаться з Milan у наступному році. Для багатьох односокетних 16-32-ядерних серверів Genoa зайва.

Те саме можна спостерігати на ринку графічних процесорів, де тон задає NVIDIA. Її нинішній топовий акселератор H100 (Lovelace) для робочих навантажень високопродуктивних обчислень та штучного інтелекту прискорює навчання до 9 разів, інференс до 30 разів, додатки HPC до 7 разів, порівняно з попереднім поколінням A100 (Ampere). Але H100 втричі дорожчий за A100. Передові нейромережеві тренери оцінять новинку – приріст їхньої продуктивності кратно перевищить здорожчання. Більшості корпоративних користувачів можливостей Ampere вистачає із головою – тому NVIDIA не поспішає пересаджувати свої промислові лінійки на архітектуру Lovelace. Усі флагмани часів Ampere (A100, A6000/A40, A5000/A30) залишаються у виробництві.

Раніше серверний ринок працював у режимі лінійного витіснення – планомірно і повністю переходив з одного покоління процесорів/платформ на нове, отримуючи поліпшені можливості (новий техпроцес, більше ядер і каналів пам'яті, вище частоту) приблизно за ціною старого заліза. Розпад ринку на сегменти з високим ступенем спеціалізації виправдовує одночасне співіснування платформ кількох поколінь. Користувачі не поспішають приміряти на себе обіцяний приріст продуктивності та переплачувати за умоглядні поліпшення в обраних додатках – бо вони не співвідносяться з їхніми власними навантаженнями. За що платити більше та чому треба міняти шило на мило? Наприклад, ніколи раніше серверний ринок не саботував перехід так, як зміну Intel Xeon Scalable другого (Cascade Lake) на третє (Ice Lake) покоління.

В економіці із затягнутими поясами інакше й не повинно бути. Будь-які капітальні витрати мають бути виправдані виразною моделлю окупності. Мода модою, але ми носимо те, що підходить за розміром.

Вночі всі кішки сірi

Бізнес-тренери вчать продавців вибудовувати воронки продажів через емоційний зв'язок із покупцем – адже як тільки споживач занурюється у проблему та починає вивчати інформацію, шанси продати йому щось зменшуються. Тому розмови про силу бренду глушать голос розуму.

Коли запит (подразник) споживача простий – як голод чи спрага, його задовольняють негайно, не обтяжуючись аналізом. При складному виборі потрібні переконливі консультанти та усвідомлені дії – щоб не вийшло так, ніби хотів зняти біль голови, а отримав новий. «Воронка» поінформованого покупця побудована на читанні спеціалізованих джерел, рекомендаціях знайомих, порадах форумних товаришів з нещастя. Для порівняльної оцінки пропозицій різних продавців корисно просити їх про перехресну критику – вони в темі, їм простіше розглянути слабкі та сильні сторони конкурентів. Коли приходить просвітлення, кішки перестають здаватися однаково сірими.

Якщо покупцю ліньки розбиратися або він пасує перед складністю предмета, то результат буде відповідним. Віра в те, що хтось подумав за вас і зробив вам добре, не робить придбаний сервер придатним під завдання – вони у всіх різні.

Філ Барден у своїй книзі «Злом маркетингу. Наука про те, чому ми купуємо» показує, що люди ухвалюють рішення про купівлю в режимі пілота (раціональне мислення) або автопілота (імпульсивне, неконтрольоване мислення). Маркетологи орієнтуються на автопілот. Нам, постачальникам серверів, доводиться постійно нагадувати покупцям, що купівля/продаж серверів без аналізу навантажень – все одно, що лікування без діагностики.

AMD та Intel напередодні нового витка конкуренції

Компанія AMD 10 листопада  презентує четверте за останню п'ятирічку покоління процесорів EPYC – Genoa. Оглянемося на перегони минулого.

Справжня конкуренція на серверному ринку виникла влітку 2017 року. Після відносно скромної першої спроби з Opteron'ами в «нульовi» AMD викотила нову зброю – архітектуру Zen з її втіленням, процесорами EPYC. На відміну від монолітного дизайну процесорів Intel, AMD обрала шлях MCM (multi-chip module) - її EPYC'і складаються з чіплетів (chiplets). Хоча це збільшує площу CPU, додає транзистори та інтерконнект, витрати компенсуються тим, що виробнику дешевше виготовити кілька невеликих кристалів, ніж один величезний.

Intel відповіла процесорами Xeon Scalable, подаючи їх як "найбільший прогрес центрів обробки даних за десятиліття" і піддала критиці мультичіповий дизайн AMD. За останні п'ять років вийшло по три покоління процесорів AMD EPYC (MCM) та Intel Xeon SP (всі моноліти). Очікувані прем'єри четвертих – AMD EPYC Genoa та Intel Xeon SP Sapphire Rapids – будуть MCM. Intel називає конструкцію своїх процесорів плитковою (tiles). Як не називай, це кінець монолітам.

У перших процесорів AMD EPYC Naples було до 32 фізичних обчислювальних ядер x86, 8 каналів пам'яті та підтримка 128 ліній PCIe 3.0 – вище за показники Intel Xeon SP першого покоління (Skylake). AMD пішла від проектування 4- та 8-процесорних систем. Багатоядерність дозволила обмежитись двопроцесорними системами, що справляються з більшістю навантажень дата-центрів. Можна сказати, тоді відкрилася перспектива односокетного майбутнього серверів . Його відлік розпочався з процесорів, помічених суфіксом P. Одного такого процесора з його 128 лініями PCIe достатньо для вузлів горизонтально-масштабованої інфраструктури, графічних (multi-GPU) обчислювачів у системах штучного інтелекту, візуалізації доповненої реальності або зберігання даних на десятках NVMe SSD. 48 ліній одного Intel Xeon для такого мало.

Друге покоління процесорів AMD EPYC Rome отримало архітектуру Zen 2 та техпроцес 7 нм. Кількість ядер на процесор зросла до 64, з'явилася підтримка PCIe 4.0. На додаток до SMP-серверів Intel спробувала увійти в "односокетний" бізнес, випустивши процесори Xeon Gold 62xxU на 20 і 24 ядер - поки AMD продавала 64-ядерні EPYC 7702P. Ринок не відреагував.

Третє покоління процесорів Intel Xeon SP Ice Lake підтягнуло технологічне відставання від AMD EPYC. З'явилася підтримка 64 ліній PCIe Gen 4 із процесора та восьми каналів пам'яті DDR4-3200. Змінився техпроцес, з'явився новий сокет. Стеля по ядрах третього покоління AMD EPYC Milan, як і раніше, залишилася вищою (64 проти 40 у Intel Xeon), ліній PCIe більше. P-серія процесорів AMD EPYC під один сокет продовжує залишатися потужним драйвером розвитку гіперконвергенції, GPU-обчислювачів та NVMe-сховищ. Група підтримки односокетних серверів на AMD EPYC за три покоління процесорів сформувалася, зміцніла та включає провідних виробників. U-серія Xeon Gold формально у лінійці Intel є, але платформ під них на ринку практично немає. Їх можна ставити у двосокетні системи, але кому цікаві сервери "з обмеженими можливостями"?

Що відомо про майбутні прем'єри?

Процесори AMD EPYC Genoa будуть випускатися за техпроцесом 5 нм. У них буде до 96 ядер, упакованих в один чіп на архітектурі Zen 4, що дасть 192 ядра у двопроцесорній платформі. З'явиться підтримка 12 каналів пам'яті DDR5-5200 і двох DIMM модулів на канал, що дозволить набрати до 3 ТБ системної пам'яті модулями по 128 ГБ. Швидкісній периферії дістанеться 128 ліній PCIe Gen 5 з одного процесора або 160 у двопроцесорному сервері.

Вихід нових Xeon 4-го покоління Sapphire Rapids знову затримується - техпроцес 7 нм і перехід на плиткову конструкцію з чотирма кристалами дається Intel нелегко. Загальна кількість ядер досягне 60 - значний крок уперед у порівнянні з Ice Lake-SP, але все ще сильно позаду Genoa. У процесорів Intel менше ліній PCIe та резервів кеш-пам'яті. Передбачувана дата показу кілька разів переносилася, кількість пробних степінгів побила рекорди, а вікно запуску планується на середину першого кварталу 2023 року.

Intel не наздожене AMD по ядрам найближчим часом. Враховуючи увагу до технологій прискорення (QuickAssist і Crypto Acceleration як приклади), Intel швидше за все бореться за високу продуктивність на ядро ​​для деяких класів робочих навантажень. AMD зміцнює лідерство у гонці за ядрами та каналами пам'яті. Додаються прискорення AI, AVX-512, а велика кеш-пам'ять L3 допоможе маскувати компроміси чіплетної архітектури. Продуктивність у широкому колі додатків поки що видається вирішальною перевагою.

Але швидкість змін сьогодні така, що через кілька років ринок може розпастись на сегменти з високим ступенем спеціалізації - і ми отримаємо зовсім інший розклад учасників.

Ніколи не кажіть фразу «чого бажаєте?»

Звідки беруться технічні завдання серверних тендерів?

Як казав Лазар Каганович (той ще чорт, але ж саме йому належать ці слова) – «кожна аварія має ім'я, прізвище та посаду».

За переважною більшістю тендерів, що проводяться, стоїть одне з двох: умисел або дурість. З першим зрозуміло. Системним корупціонерам не заважають САП, НАЗК, НАБУ та інші органи нагляду. З другим можна і треба боротися – за замовників, які так чинять не зі зла. Їм сказали купити сервер – вони думають, що купувати сервери те саме, що купувати каструлі чи мангали для шашлику. Багатьом невтямки, що купівлі сервера передує аналіз навантажень, і що шукати треба не вітрину з широкою пропозицією, а консультанта, який виставить цільові орієнтири для пошуку.

Від невідповідності серверів цільовим завданням всім погано – і замовникам (сервери не виправдовують витрати) і постачальникам (тінь завжди впаде і на них).

Допоможіть сумлінним замовникам:

  • Завжди обговорюйте цільове призначення сервера;
  • Ніколи не починайте з бренду серверів чи компонентів;
  • Завжди беріть до уваги обставини та доступний бюджет;
  • Ніколи не пропонуйте замовнику самому вибрати або сконфігурувати сервер;
  • Завжди нагадуйте замовникам, що доступність заліза на ринку впливає на рішення: краще горобець в руці, ніж лелека в небі;
  • Ніколи не кажіть фразу «чого бажаєте?» – інакше все життя доведеться працювати офіціантом.

Сертифікати як тендер-лок

Як вигравати серверні тендери (у змові з покупцем)?

Добре, якщо йдеться про дороге А-бренд обладнання та ти перший встигаєш реєструвати проекти у вендора. Адресна знижка – захист від конкурентів.

А якщо ні? Тоді доводиться наповнювати тендерні специфікації тендер-локами: технологічними, процедурними, документальними – скільки вистачить фантазії. Якщо процедура закупівель спрощена, замовник має право вказати конкретний виріб і не розглядати “аналоги”. Але якщо ні – за будь-якою конкретикою піде звинувачення у дискримінації, тендер завалять. Якщо ти попрацював і зашифрував сервер відстороненими багатосторінковими описами, завжди знайдуться нероби, які все розшифрують.

Можна обкласти тендер утомливим документообігом – довідками про несудимість, звітами податкової, всілякими виписками. Спеціально навчені люди пройдуть і цей квест за день.

Найпростіше купити собі якийсь сертифікат ISO поекзотичніше, і підкладати вимогу його обов'язкової наявності у “свої” тендери. Продавці сертифікатів роблять "легітимні документи під ключ за кілька днів".

Це не повинен бути ISO 9001 (вимоги до якості управління всередині організацій) – він поширений і не позбавлений сенсу (“відокремити стабільних постачальників від пройдисвітів”). Краще придбати інші: ISO 14001 (екологія), ISO 37001 (антикорупція), ISO 45001 (охорона праці) або ISO 50001 (енергоефективність). Коли у тебе такий набір сертифікатів є, а в конкурентiв  нi, ти  - на конi. Те, що сертифікація добровільна і до серверів не має стосунку, не перешкода. Замовнику ТАК ТРЕБА.

Минулого літа траплялися тендери з якимись антиковiдними сертифікатами, зараз зникли. Мабуть, сервери успішно перемогли коронавірус.

NVIDIA віддає перевагу AMD

Багато років GPU-сервери традиційно робили на інтелівських платформах, хоча AMD вже п'ять років пропонує серверному ринку передові технологічні рішення.

Консерватизм виробників сильно похитнув випуск самої NVIDIA два роки тому сервера DGX A100 – універсальної системи під завдання AI із вісьма графічними прискорювачами A100 загальною продуктивністю 5 петафлопс. Це не перший сервер від NVIDIA, але вперше у своїй практиці компанія вибрала центральні процесори AMD, не Intel (два AMD EPYC 7742).

Потім з'явилося і простіше рішення - станція для робочих груп DGX Station A100 на чотирьох акселераторах A100 і одному AMD EPYC 7742.
Інтереси AMD та NVIDIA зійшлися.

Процесори EPYC були і залишаються ключовим компонентом високопродуктивних обчислень (HPC). Багатоядерність CPU не завадить там, де є змішані навантаження, в багатозадачному і розрахованому на багато користувачів середовищі. Лінії PCIe потрібні периферійним пристроям, головним чином, графічним акселераторам. Перевага по ядрах CPU та кількості доступних ліній PCIe (крім GPU є й інші споживачі: NVMe SSD, мережні карти, акселератори FPGA) дає AMD перевагу над Intel.

Про капітальні та операційні витрати

Іноді я розважаюсь і запитую замовників серверів на прозорих тендерних майданчиках, чому специфікації їхніх “технічних завдань” такі дивні? Найчастіше організатори відмовчуються. Буває, підключають до розпитувань “інженерів”. Якщо відповідають, то стримано: “дякуюємо за звернення, бо так треба”.

Усі підприємці несуть капітальні та операційні витрати. У капітальні входить разове придбання необоротних активів, в операційні – повсякденні витрати бізнесу. Купівля серверів та безстрокових ліцензій на програмне забезпечення відноситься до капітальних, оплата розхідників, оренди, праці персоналу – до операційних. До операційних витрат потрапляє утримання cпівробітників, зайнятих підготовкою тендерної документації, вичитуванням договорів, перевіркою сертифікатів, моніторингом ринкових пропозицій – діяльністю, продуктивність якої аршином загальним не виміряти.

Скажімо, на державному забезпеченні перебуває 55 тисяч інспекторів. Їхня “ефективність” будується на показниках, які вони приписують собі самі (тероризуючи бізнес). Навпаки, будь-який власник приватного підприємства знає природу своїх доходів та витрат: що (хто) саме тягне бізнес на дно, а що (хто) – до зірок. Мало вирішити, купувати сервери у володіння чи орендувати послуги у хмарі. Недостатньо проводити тендери з метою економії. Треба завжди зіставляти гіпотетичну економію з адміністративними витратами на її досягнення.

Зазвичай, знайти і триматися пристойних радникiв/постачальників дешевше, ніж годувати своїм коштом загони галапасів.

Про надійність серверів та серверних компонентів

Будь-який користувач, особливо корпоративний, зацікавлений у безперебійній роботі систем. Якщо поломку простого персонального пристрою пережити відносно легко, то відмова серверів і СЗД загрожує великими втратами. Є дві моделі поведінки системних адміністраторів: а) віддати все на відкуп іншим (обкластися сервісними контрактами, в ідеалі – вивести критичні операції в хмару) і б) самому вжити запобіжні заходи (з урахуванням ризиків, тривалості та складності позаштатних процедур: дублювання функцій, міграції, резервування даних, їх відновлення). Перша приваблива делегуванням відповідальності, але є витратною для власника. Друга заощаджує кошти, але потребує кваліфікації.

Ще не перевелися ентузіасти, які докопуються до природи речей: стежать за прес-релізами, читають порівняльні огляди, аналізують чужі звіти – щоби вплинути на рішення про закупівлю нових серверів. Читання корисне у будь-якому випадку. Проблема в тому, що надійність, на відміну від продуктивності або інших більш очевидних метрик – погано вимірний показник. У специфікаціях компонентів характеристики надійності є, наприклад Endurance (ресурс перезапису в пам'ять SSD), MTBF – середній час напрацювання HDD на відмову або URE (ймовірність помилки читання даних з носія). Як будь-які “середні по лікарні” значення, вони мало чим допоможуть адміністратору-начітнику. Йому, звичайно, не пощастить.

До відкритих публікацій варто відноситися виважено. Самі виробники ніколи не діляться статистикою відмов обладнання. А коли це роблять сторонні оглядачі, завжди треба звертати увагу на охоплення (супутню статистичну похибку) і цілі, що переслідуються. Так, хмарний оператор Backblaze з 2013 року публікує щоквартальні звіти про відмови HDD. Їхня маркетингова цінність зрозуміла. Практична цінність для покупця серверів та жорстких дисків – ні. Саме тому, що "середня температура по лікарні" ніяк не співвідноситься з конкретно вами. Тому що у вас все по-іншому: профіль навантажень, умови експлуатації, засоби забезпечення доступності даних, швидкість реагування та гарантійні зобов'язання постачальника. Зрештою, коробка з дисками на шляху до вас може впасти, а через рік ви звинувачуватимете виробника в серійному браку.

Вибирати треба не виробника, а постачальника. Такого, щоб був залучений до особливостей вашої серверної інфраструктури та пропонував рішення з найменшими ризиками залежно від обставин непереборної сили.

Виробники повідомляють про рекордний прибуток. Але не Intel

Вийшов звіт Intel з розчаровуючими результатами Q2 та похмурими прогнозами (переклад нижче).

Знайшли кого звинувачувати – AMD, з її часткою 15% у серверах.

А що сама Intel робила останній рік у серверах? Тільки один приклад:

• Q2’21 – представлення лінійки Xeon SP 3-го покоління із переходом на новий сокет

• планувалося на початок року, відкладено на Q4'22 оголошення Xeon SP 4-го покоління з переходом знову на новий сокет

Навіщо треба було видавати нову платформу, щоб за рік знову перейти на ще нову? Від цієї каруселі у вендорів рябить в очах. Вони не готові власним коштом оплачувати свято постійного оновлення дизайну плат і платформ. Особливо коли нове виходить дорожче, за скромних вигод.

А що покупці? Вони сидять до наступного повороту стовпової дороги. Їм сказали чекати на DDR5 - вони і чекають.

Коротко, прозвітували так:

28 липня Intel опублікувала свої фінансові результати за другий квартал 2022 року, продемонструвавши зниження виручки за GAAP на 22% у порівнянні з минулим роком, до 15,3 млрд дол., і вперше за кілька десятиліть повідомила про збитки в розмірі 500 млн дол. за квартал. Валовий прибуток склав 36,5%, що на 20,6 в.п. менше, ніж за той самий період рік тому. Але витрати на дослідження та розробки, злиття та поглинання збільшилися на 17% до 6,2 млрд доларів США.

Генеральний директор Intel Пет Гелсінгер звинуватив раптовий і швидкий спад економічної активності як причину нестандартних показників, а також проблем із виконанням планів компанією. Він пообіцяв працювати над зміною умов ведення бізнесу та тісно співпрацювати з клієнтами, залишаючись при цьому зосередженим на стратегії та довгострокових можливостях для прискорення трансформації. З урахуванням продуктивності ключових бізнес-підрозділів, група клієнтських обчислень, яка приносить найбільшу частку її доходів, скоротилася на 25% порівняно з минулим роком до 7,7 млрд доларів. Група центрів обробки даних та штучного інтелекту повідомила про зниження продажів на 16% до 4,6 млрд дол. Intel Foundry Services (IFS) продемонструвала різке зниження на 54% у другому кварталі, приносячи дохід лише у 122 млн дол.

Причина значного спаду у найбільшому бізнес-підрозділі Intel багато в чому пов'язана зі зниженням попиту на ПК, тоді як OEM-виробники коригують свої запаси. А Intel пояснила 16-відсоткове скорочення бізнесу центрів обробки даних та штучного інтелекту конкуренцією з боку AMD, а також зниження середньої ціни продажу через конкуренцію, а також скорочення запасів OEM.

__

"Хто всрався? Невiстка"

Про репутацію

Коли клієнт приходить за сервером, при цьому відмовляючись обговорювати програми, та ще й вчить постачальника з чого повинен бути зроблений сервер (скільки в ньому має бути процесорних ядер, пам'яті та які саме диски), краще, що можна зробити – ввічливо, але твердо послати клієнта …. у розетку.

Багатьом подобається такий бізнес, коли тобі пальцем показують, що хочуть купити, а ти скачеш кабанчиком до дистриб'ютора, вибиваєш ціну і привозиш. Це нормально для найпростіших гаджетів. Будь-яке завдання складніше курячого яйця вимагає хоча б мінімальної оцінки доцільності.

Серверів це стосується особливо. Сервери – інструмент вирішення певних ресурсомістких завдань. Який сервер, такою й буде робота. Перше, що варто зробити постачальнику сервера – розібратися в задачі та утримати замовника від недоречних фантазій.

Репутація складається з розуміння предмета, а не з навички догоджати людині з грошима руках.

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT