Компанія Google оголосила запуск своїх кастомних чипів Ironwood для хмарних клієнтів. Ці TPU з найпотужнішою архітектурою АІ-акселераторів компанії на сьогодні.



Нові чипи, поряд із новими Arm-базованими інстансами Axion, стануть доступними клієнтам найближчими тижнями. Google зазначає, що поява АІ-агентів, які вимагають глибокого обґрунтування та розширеного управління завданнями, визначає нову еру, де попит на АІ-обчислення для інференсу значно зріс. Власні моделі Google, включно з Gemini, Veo та Imagen, а також великі моделі третіх сторін, як-от Claude від Anthropic, навчаються та розгортаються на TPU.



Нагадаємо, компанія представила Ironwood на Google Cloud Next 2025 у квітні. Архітектура нового покоління дозволяє масштабувати до 9 216 чипів в одному серверному поді, з'єднаних міжчиповим інтерконектом (inter-chip interconnect, ICI), що забезпечує пропускну здатність до 9,6 терабіт на секунду. Вони можуть бути підключені до колосального обсягу спільної високошвидкісної пам'яті (HBM) – 1,77 петабайта.



Компанія заявила, що нова архітектура на базі Ironwood може забезпечити у 118 разів більше FP8 ExaFLOPS, ніж найближчий конкурент, і більш ніж у чотири рази кращу продуктивність для навчання та інференсу, ніж Trillium, попереднє покоління TPU.



Для максимізації можливостей Ironwood Google додала новий програмний рівень. Anthropic, ранній користувач Ironwood, заявив, що чипи забезпечили "вражаючі переваги у співвідношенні ціни та продуктивності", дозволяючи їм обслуговувати масивні моделі Claude.



Google також оголосила про розширення пропозицій Axion двома новими послугами на етапі попереднього перегляду: N4A (віртуальні машини Axion другого покоління) та C4A metal (перші Arm-базовані bare-metal інстанси компанії).



Axion — це кастомний, Arm-базований центральний процесор Google, розроблений для забезпечення енергоефективної продуктивності для загальноцільових робочих навантажень. Марк Ломаєр (Mark Lohmeyer), віцепрезидент і генеральний менеджер з АІ та обчислювальної інфраструктури Google Cloud, раніше зазначав, що процесори Axion матимуть на 30% вищу продуктивність, ніж найшвидші Arm-процесори, доступні у хмарі сьогодні, на 50% вищу продуктивність, ніж порівнянні процесори x86, та на 60% кращу енергоефективність.



Нові інстанси Axion покликані забезпечити операційну основу для складних АІ-робочих процесів, таких як підготовка даних, аналітика та управління віртуальними службами, які розміщують інтелектуальні програми. N4A підтримує до 64 віртуальних CPU та 512 гігабайт пам'яті DDR5, а C4A metal надає виділені фізичні сервери, що мають до 96 vCPU та 768 гігабайт пам'яті.

