`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

NVIDIA представила Vera CPU - першу архітектуру для агентного АІ з ефективністю у два рази вищою за аналоги

+11
голос

Компанія NVIDIA сьогодні представила NVIDIA Vera CPU, який позиціонується як перший у світі процесор, спеціально розроблений для епохи агентного АІ та навчання з підкріпленням. 

Зазначається, що новинка забезпечує вдвічі вищу ефективність та працює на 50% швидше порівняно з традиційними серверними процесорами стійкового масштабу. 

Розробка стала відповіддю на розвиток агентного АІ, де продуктивність і вартість дедалі більше залежать від інфраструктури, що підтримує моделі для планування завдань, запуску інструментів, взаємодії з даними та перевірки результатів. 

Новий процесор базується на успіху архітектури NVIDIA Grace і дозволяє організаціям будь-якого розміру створювати АІ фабрики для масштабного впровадження інтелектуальних агентів. Завдяки найвищій однопотоковій продуктивності та значній пропускній здатності на кожне ядро, Vera представляє новий клас CPU, що забезпечує швидкий відгук та ефективність для таких сервісів, як помічники для написання коду, а також споживчі та корпоративні агенти. Провідні гіперскейлери, серед яких Alibaba, CoreWeave, Meta та Oracle Cloud Infrastructure, вже співпрацюють з NVIDIA для впровадження нових чипів. До них приєдналися і світові виробники систем, зокрема Dell Technologies, HPE, Lenovo та Supermicro.

Засновник і генеральний директор NVIDIA Дженсен Хуанг (Jensen Huang) зазначив, що поява Vera відбувається у переломний момент для галузі. «Vera прибуває у переломний момент для АІ. Оскільки інтелект стає агентним - здатним міркувати та діяти - важливість систем, що оркеструють цю роботу, зростає. CPU більше не просто підтримує модель; він керує нею. Завдяки проривній продуктивності та енергоефективності, Vera відкриває АІ системи, які думають швидше та масштабуються далі», заявив Дженсен Хуанг. Для забезпечення роботи масштабних АІ фабрик компанія представила нову стійку, що інтегрує 256 процесорів Vera з рідинним охолодженням.

Технічно Vera CPU є частиною платформи NVIDIA Vera Rubin NVL72, де процесори поєднуються з графічними чипами через технологію NVLink-C2C. Це забезпечує когерентну пропускну здатність 1,8 ТБ/с, що у сім разів перевищує показники PCIe Gen 6. Процесор містить 88 кастомних ядер Olympus, спроєктованих NVIDIA для роботи з компіляторами, аналітичними конвеєрами та сервісами оркестрації. Кожне ядро здатне виконувати два завдання одночасно завдяки технології NVIDIA Spatial Multithreading, що забезпечує передбачувану продуктивність у багатокористувацьких середовищах.

Енергоефективність системи підвищено завдяки другому поколінню підсистеми пам’яті з низьким енергоспоживанням на базі LPDDR5X, що забезпечує пропускну здатність до 1,2 ТБ/с. Це вдвічі більше, ніж у процесорів загального призначення, при вдвічі меншому споживанні енергії. Перші тести в реальних умовах уже показали вражаючі результати. Зокрема, засновник і генеральний директор Redpanda Алекс Галлего (Alex Gallego) повідомив про зниження затримки до 5,5 раза при роботі з потоковими даними. «Vera представляє новий напрямок в архітектурі CPU з більшим обсягом пам'яті та меншими витратами на ядро», зазначив він.

До впровадження NVIDIA Vera також готуються провідні національні лабораторії США та Європи, зокрема Leibniz Supercomputing Centre та TACC. Директор з високопродуктивних обчислень у TACC Джон Кейз (John Cazes) зауважив, що перші тести на шести наукових додатках показали вражаючий крок вперед для наукових обчислень. Майкл Труелл (Michael Truell), співзасновник і генеральний директор Cursor, також підтвердив намір використовувати Vera для прискорення роботи агентів, що пишуть код. Наразі NVIDIA Vera перебуває на стадії повномасштабного виробництва, а доступність систем від партнерів очікується у другій половині 2026 року.

Стратегія охолодження ЦОД для епохи AI

+11
голос

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT