Закон спадної віддачи або Витратне лідерство

29 январь, 2026 - 11:25Андрій Тищенко

Існує просте економічне правило: якщо постійно вкладатись в один і той самий ресурс, то з певного моменту кожна наступна одиниця інвестицій даватиме все менший приріст результату. В технологіях закон спадної віддачі проявляється навіть жорсткіше, ніж у класичній економіці. Сучасні cистеми є багатокомпонентними, зі зростанням їх складності витрати на узгодження та координацію нівелюють очікуваний приріст продуктивності.

Кожен наступний відсоток «прискорення» коштує дедалі дорожче. Класичний приклад - закон Амдала, який описує фундаментальне обмеження масштабування при паралельних обчисленнях: якщо частина задачі не піддається паралелізації, загальний час виконання не може бути меншим за час виконання найповільнішого фрагмента. Скажімо, у АІ-інференсі, якщо певні етапи обробки залишаються послідовними, збільшення кількості графічних процесорів дає все менший ефект.

Значна частина інженерної роботи - це постійна боротьба зі спадною віддачею. Технологічний прогрес приносить очевидні покращення: тонші техпроцеси, багатоядерність, кешування, паралелізм. Водночас ускладнюється взаємодія між компонентами, падають робочі частоти та ефективність, а енергоспоживання стає головним обмежувальним фактором. Реальний виграш забезпечує лише спеціалізація. Індустрія проживає «одну битву за іншою» двох сил, що постійно тягнуть стан справ у протилежні боки: закону Мура (більше транзисторів, більша щільність) та закону спадної віддачі (менший приріст користі з кожного транзистора).

Прогрес оплачує споживач - і не обов’язково напряму. Поточна хвиля витрат світових лідерів на АІ-розробки вже призвела до каскадного зростання цін на всю мікроелектроніку. Нова реальність змушує затягувати паски, ухвалювати зваженіші рішення та охолоджувати максималізм. Частково гонитву за «найкращим» стримують надмірні витрати на досягнення бажаного, природним чином.

Попри такі прояви закону спадної віддачі на рівні окремо взятої кишені, не все так сумно: незначне послаблення вимог може суттєво спростити реалізацію, без помітної шкоди для продуктивності. Ось кілька прикладів раціонального вибору в площині «очікування - витрати».

NVIDIA RTX PRO 6000 Blackwell: Workstation Edition проти Max-Q

Архітектура NVIDIA Blackwell стала значним кроком вперед порівняно з попереднім поколінням графічних процесорів Ada. Зокрема, старші прискорювачі для професійних робочих станцій, RTX PRO 6000 Blackwell Workstation Edition (WE) та RTX PRO 6000 Blackwell Max-Q Workstation Edition (Max-Q), отримали подвоєний обсяг графічної пам’яті - 96 ГБ.

Закон спадної віддачи або Витратне лідерство

Найпомітнішою відмінністю між двома версіями RTX Pro 6000 Blackwell є енергоспоживання. Max-Q утримує його на прийнятному рівні 300 Вт, тоді як флагманська WE споживає вражаючі 600 Вт і є значно вибагливішою до оточення: просторих корпусів, потужних блоків живлення та підсистем охолодження. Для однієї такої карти потрібен блок живлення потужністю 1000-1200 Вт зі штатним 16-піновим роз’ємом 12VHPWR / CEM5, сертифікованим для високих струмів. Значні габарити та конструктивні особливості карти потребують ретельної організації повітряного потоку в корпусі.

Фізично WE не поміщається у стандартні 4U-шасі, а встановлення навіть двох таких карт в одну робочу станцію є викликом. Натомість можливість мати розмістити декілька GPU в одній системі без потреби у спеціалізованих рішеннях живлення чи охолодження є суттєвою перевагою Max-Q у сценаріях масштабування GPU-продуктивності.

Порівняння RTX PRO 6000 WE та Max-Q в завданнях створення контенту показує: незважаючи на вдвічі менше енергоспоживання, Max-Q у більшості випадків тримається майже на рівні WE. В After Effects Max-Q відстала на 5-9%, у Unreal Engine - на 14% (і була лише трохи швидшою за RTX 6000 Ada). Автономні рендерери, такі як V-Ray, Blender, Redshift та Octane, також показали незначне відставання Max-Q на 5-13%.

Взагалі-то для більшості користувачів, зосереджених на After Effects та Adobe Creative Cloud, кращим вибором з урахуванням ціни будуть навіть не RTX PRO 6000, а споживчі карти GeForce RTX серії 50.

AMD EPYC 4545P

Сервери AMD на сокеті АМ5 є вдалою альтернативою не лише Intel Xeon E (Xeon 6300), але і більшості рішень класу Intel Xeon Silver, завдяки високій процесорній продуктивності та більш дешевій платформі.

У лінійці процесорів AMD EPYC 4005 особливо виділяється 16-ядерний AMD EPYC 4545P. Його тепловий пакет 65 Вт становить лише 38% від показників флагманських моделей EPYC 4565P та EPYC 4585PX із TDP 170 Вт. За це доводиться платити нижчою базовою частотою - 3,0 ГГц проти 4,3 ГГц, проте максимальна частота в 5,4 ГГц майже не поступається 5,7 ГГц у старших процесорів.

За результатами тестів Phoronix AMD EPYC 4545P забезпечує 88% продуктивності від 16-ядерного EPYC 4565P та 84% від флагманського, також 16-ядерного EPYC 4585PX із технологією 3D V-Cache. За такого незначного відставання напрочуд мале енергоспоживання та менша ціна роблять AMD EPYC 4545P природним вибором для розгортання недорогих високопродуктивних серверів веб-додатків, edge-рішень і будь-яких інфраструктурних завдань із щільним розміщенням обладнання.

Багатоканальність пам’яті

Заповнення всіх каналів пам'яті процесора загалом вважається правильною практикою. Проте більшість серверних додатків є значно більш чутливими до затримок (latency), ніж до пропускної спроможності підсистеми пам’яті (bandwidth). Причина проста: навантаження баз даних і віртуалізованих середовищ складаються з великої кількості дрібних, коротких і взаємозалежних доступів до оперативної пам’яті та постійних носіїв, у яких процесор переважно очікує дані, а не послідовно передає гігабайти інформації. Висока потокова швидкість важлива у завданнях аналітики, наукових розрахунках і ШІ-навантаженнях – зокрема під час попередньої обробки даних та інференсу на CPU.

Показовим є досліження 8 vs. 12 Channel DDR5-6000 Memory Performance With AMD 5th Gen EPYC, під час якого майже 200 бенчмарків використовувалися для оцінки впливу заповнення всіх 12 каналів пам’яті процесора AMD EPYC 9655 (1P) модулями DDR5-6000. Різниця в продуктивності між конфігураціями з 8 та 12 модулями виявилася настільки незначною, що автор дійшов висновку про доцільність вибору дешевшої материнської плати з 8 слотами DIMM.

Сьогодні внесок модулів оперативної пам’яті у загальну вартість сервера є настільки відчутним, що рекомендація заповнювати всі слоти DIMM у відповідності до кількості каналів CPU є доволі цинічною. Обсяг DRAM має визначатися реальними потребами додатків і наявним бюджетом. Кількість встановлених модулів є другорядним фактором.

Порада, звідки не чекали

Навіть самі виробники закликають до стриманості. Із початком постачань нового процесора Ryzen 7 9850X3D компанія AMD прямо зазначає, що не варто гнатися за пам’яттю DDR5-6000, яку традиційно вважають оптимальною. Новинка демонструє стабільну й передбачувану продуктивність і з помітно повільнішою пам’яттю.

За даними AMD, різниця в ігровій продуктивності Ryzen 7 9850X3D між пам’яттю зі швидкістю 4800 і 6000 МТ/с становить менше ніж 1 %, тоді як вартість модулів DDR5-6000 приблизно на 20 % вища. Це наочно ілюструє класичну ситуацію спадної віддачі: додаткові витрати майже не трансформуються в практичний виграш.

«Найкраще - ворог достатнього»

Повсюдно і постійно рішення, що знаходяться «на крок нижче від флагмана», забезпечують бажане за значно менші гроші, з більш простою реалізацією. Раціональний вибір полягає не в гонитві за максимумом характеристик, а в досягненні оптимального балансу між можливостями, ціною та реальними потребами.

Розуміння зазвичай приходить через гаманець.