AMD представила деталі про свої нові АІ-чипи

13 июнь, 2025 - 10:45

У четвер компанія AMD оприлюднила нові деталі про свої чіпи АІ нового покоління, серію Instinct MI400, які надійдуть у продаж наступного року.

За словами AMD, чипи MI400 можна буде зібрати в повну серверну стійку під назвою Helios, що дозволить об'єднати тисячі процесорів таким чином, щоб їх можна було використовувати як одну систему «масштабу стійки».

«Вперше ми спроектували кожну частину стійки як єдину систему», — заявила генеральний директор AMD Ліза Су на презентації в Сан-Хосе.

Генеральний директор OpenAI Сем Альтман з'явився на сцені разом із Су і заявив, що його компанія буде використовувати чіпи AMD.

«Коли ви вперше розповіли мені про технічні характеристики, я подумав, "Не може бути, це звучить абсолютно божевільно", — сказав Альтман. Це буде щось дивовижне».

Технологія AMD для стійки також дозволяє її новітнім чіпам конкурувати з чіпами Blackwell від Nvidia, які вже випускаються в конфігураціях з 72 графічними процесорами, з'єднаними між собою. Nvidia є основним і єдиним конкурентом AMD у сфері графічних процесорів для великих центрів обробки даних, призначених для розробки та розгортання додатків АІ.

Досі Nvidia домінувала на ринку графічних процесорів для центрів обробки даних, частково тому, що вона була першою компанією, яка розробила програмне забезпечення, необхідне розробникам АІ для використання чіпів, спочатку призначених для відображення графіки для 3D-ігор. Протягом останнього десятиліття, до буму АІ, AMD зосередилася на конкуренції з Intel у сфері серверних процесорів.

Су заявила, що MI355X може перевершити чипи Blackwell, незважаючи на те, що Nvidia використовує своє «власне» програмне забезпечення CUDA. «Це свідчить про те, що ми маємо дійсно потужне обладнання, про що ми завжди знали, але також показує, що відкриті програмні платформи досягли значного прогресу», — заявила вона.

Ендрю Дікманн, генеральний менеджер AMD з графічних процесорів для центрів обробки даних, заявив у середу, що АІ-чипи від AMD будуть дешевшими в експлуатації та придбанні.

AMD очікує, що загальний ринок чіпів для АІ перевищить 500 мільярдів доларів до 2028 року. Зараз понад 90% належить Nvidia, за оцінками аналітиків.

За словами Су, за останній рік AMD придбала або інвестувала в 25 компаній, що займаються АІ, включаючи придбання на початку цього року компанії ZT Systems, виробника серверів, який розробив технологію, необхідну AMD для створення своїх систем розміром зі стійку. «Ці системи АІ стають надзвичайно складними, і повнофункціональні рішення є дійсно критично важливими», — сказала Су.

AMD стверджує, що її MI355X може забезпечити на 40% більше токенів на долар, ніж чіпи Nvidia, оскільки її процесори споживають менше енергії, ніж чіпи конкурента.

AMD представила деталі про свої нові АІ-чипи

Відповідно до свого приблизно річного циклу оновлення, AMD підтвердила, що серія Instinct MI400 з'явиться на початку 2026 року, продемонструвавши величезний стрибок в області пам'яті, пропускної здатності міжз'єднань і обчислювальної потужності. Кожна карта MI400 оснащена дванадцятьма стеками HBM4, що забезпечують 432 ГБ вбудованої пам'яті і пропускну здатність пам'яті майже 19,6 ТБ/с. Ці ранні модулі HBM4 забезпечують пропускну здатність приблизно 1,6 ТБ/с кожен, що трохи менше позначки в 2 ТБ/с. У плані обчислювальної потужності AMD оцінює MI400 в 20 петафлопс пропускної здатності FP8 і 40 петафлопс FP4, що в два рази перевищує продуктивність розріджених матриць сучасних карт MI355X. Але справжнім проривом є те, як AMD масштабує ці графічні процесори. Досі через Infinity Fabric можна було підключити до восьми карт, а все, що перевищувало цю кількість, доводилося підключати через Ethernet.

Модернізований матричний зв'язок MI400 тепер забезпечує швидкість 300 ГБ/с, що майже в два рази перевищує швидкість серії MI350, дозволяючи створювати кластери повного река без використання більш повільних мереж. Це оновлення відкриває шлях для «Helios», повністю інтегрованого рішення AMD для стійок штучного інтелекту. Воно поєднує в собі майбутні процесори EPYC «Venice» з графічними процесорами MI400 і мережевим обладнанням, відповідним за розміром, пропонуючи операторам дата-центрів готове рішення. AMD також не ухилилася від порівнянь. Стійка Helios з 72 картами MI400 забезпечує тензорну продуктивність приблизно 3,1 екзафлопса і 31 ТБ пам'яті HBM4. Система NVIDIA Vera Rubin, яка, як планується, буде оснащена 72 графічними процесорами і 288 ГБ пам'яті кожен, як очікується, досягне продуктивності близько 3,6 екзафлопса, при цьому можливості AMD перевершують її як за пропускною здатністю, так і за ємністю. І якщо цього недостатньо, вже ходять чутки про більш потужну систему MI450X IF128. Вона повинна з'явитися в кінці 2026 року і буде безпосередньо пов'язувати 128 графічних процесорів з Infinity Fabric зі швидкістю 1,8 ТБ/с в обох напрямках на кожен пристрій, відкриваючи можливості для створення дійсно масивних кластерів штучного інтелекту в масштабі стійки.

AMD представила деталі про свої нові АІ-чипи

Заснований на новітній обчислювальній архітектурі CDNA 4 компанії, прискорювач MI350X розроблений для конкуренції з серією AI GPU NVIDIA B200 «Blackwell», причому в своїй презентації AMD порівнює Instinct MI355X з B200. Чіп представляє не тільки архітектуру CDNA 4, але і новітній програмний стек ROCm 7, і апаратну екосистему, засновану на галузевому стандарті Open Compute Project, яка поєднує в собі процесори AMD EPYC Zen 5, графічні процесори серії Instinct MI350, мережеві карти AMD-Pensando Pollara з підтримкою Ultra-Ethernet і галузеві стандартні стійки і вузли, як з повітряним, так і з рідинним охолодженням.

MI350 — це гігантський графічний процесор для AI на основі чипсетів, що складається зі складених одна на одну кремнієвих пластин. Є дві базові плитки, які називаються I/O dies (IOD), кожна з яких побудована за 6-нм технологічним процесом TSMC N6. Ця плитка має мікроскопічну проводку до чотирьох плиток Accelerator Compute Die (XCD), укладених зверху, крім 128-канальних контролерів пам'яті HBM3E, 256 МБ пам'яті Infinity Cache, інтерфейсів Infinity Fabric і кореневого комплексу PCI-Express 5.0 x16. XCD побудовані на 3-нм технологічному процесі TSMC N3P. Вони містять 4 МБ кешпам'яті L2 і чотири шейдерних движка, кожен з 9 обчислювальними блоками. Таким чином, кожен XCD має 36 CU, а кожен IOD — 144 CU. Два IOD з'єднані між собою двонаправленим з'єднанням зі швидкістю 5,5 ТБ/с, яке забезпечує повну когерентність кешу між двома IOD. Пакет має в цілому 288 CU. Кожен IOD керує чотирма стеками HBM3E на 144 ГБ пам'яті, пакет має 288 ГБ.

Хоча MI350 з 288 обчислювальними одиницями і 288 ГБ пам'яті може функціонувати як один графічний процесор, AMD розробила інноваційні способи поділу графічного процесора і його фізичної пам'яті по-різному, по IOD і по XCD.

На рівні платформи кожне лезо підтримує до восьми графічних процесорів серії MI350, з пулами пам'яті, включеними через точкову мережу зі швидкістю 153,6 ГБ/с, що з'єднує кожен пакет з кожним іншим пакетом на вузлі. Крім того, кожен пакет має з'єднання PCI-Express 5.0 x16 з одним з двох процесорів EPYC «Turin» вузла, що здійснюють послідовну обробку.