На конференції AWS re:Invent компанії NVIDIA та Amazon Web Services оголосили про розширення стратегічної співпраці. Нові технологічні інтеграції охоплюють інтерконекти, хмарну інфраструктуру, відкриті моделі та фізичний штучний інтелект (АІ).
У рамках цієї співпраці AWS буде підтримувати платформу NVIDIA NVLink Fusion - рішення для створення кастомної AI-інфраструктури. Це дозволить інтегрувати NVLink Fusion у фірмові чипи AWS, включаючи наступне покоління Trainium4 (для навчання та інференсу агентського АІ), процесори Graviton та інфраструктуру віртуалізації Nitro System.
Використання NVLink Fusion, яке поєднує scale-up інтерконект NVLink з архітектурою MGX, дозволить AWS прискорити виведення на ринок власних AI-можливостей хмарного масштабу. Ця технологія, яка створює швидкі з’єднання між різними типами чипів, є критично важливою для тренування великих моделей АІ, де тисячі машин повинні бути об’єднані в єдину мережу.
«Попит на GPU-обчислення стрімко зростає. Завдяки інтеграції NVIDIA NVLink Fusion у AWS Trainium4 ми об'єднуємо нашу scale-up архітектуру з кастомними чипами AWS для створення нового покоління прискорених платформ», - заявив Дженсен Хуан (Jensen Huang), засновник і генеральний директор NVIDIA.
Метт Гарман (Matt Garman), генеральний директор AWS, зазначив, що інтеграція NVLink Fusion у Trainium 4, Graviton та Nitro System надасть клієнтам нові можливості для прискорення інновацій.
Нові сервери та AI Factories
Паралельно Amazon оголосила про випуск нових серверів на базі чипів Trainium3. Ці сервери, які вже доступні, містять по 144 чипи та пропонують більш ніж учетверо більшу обчислювальну потужність порівняно з попереднім поколінням АІ від AWS, при цьому споживаючи на 40% менше енергії. Дейв Браун (Dave Brown), віцепрезидент AWS з обчислювальних послуг та машинного навчання, підкреслив, що AWS прагне конкурувати з суперниками на основі співвідношення ціна-продуктивність.
Крім того, компанії зобов'язалися розгортати Sovereign AI (суверенні АІ) хмари по всьому світу. AWS запускає AI Factories — нову хмарну пропозицію, що надаватиме клієнтам виділену інфраструктуру безпосередньо в їхніх дата-центрах, яка працює на чипах NVIDIA Blackwell (HGX B300, GB300 NVL72, RTX PRO 6000 Server Edition) та комутаторах NVIDIA Spectrum-X. Це дозволить організаціям використовувати передові AI-сервіси, зберігаючи при цьому повний контроль над даними та дотримуючись місцевих регуляторних вимог.
Розширення програмного стека
Партнерство також поширюється на інтеграцію програмного забезпечення NVIDIA з екосистемою AWS.
Amazon Bedrock тепер інтегрує відкриті моделі NVIDIA Nemotron (Nemotron Nano 2 та Nemotron Nano 2 VL), що дозволяє розробникам створювати спеціалізовані агентські AI-застосунки.
Amazon OpenSearch Service отримав безсерверну GPU-акселерацію для створення векторних індексів, що працює на бібліотеці NVIDIA cuVS. Ранні користувачі спостерігають до 10 разів швидше векторне індексування при чверті вартості, що прискорює такі динамічні методи АІ, як генерація зі збагаченням за допомогою пошуку (RAG). AWS є першим великим хмарним провайдером, що пропонує безсерверне векторне індексування з GPU NVIDIA.
Для Фізичного АІ (робототехніки) світові фундаментальні моделі NVIDIA Cosmos доступні як мікросервіси NVIDIA NIM на Amazon EKS та AWS Batch. Це дозволяє використовувати симуляційні фреймворки, як-от NVIDIA Isaac Sim та Isaac Lab, для тренування та валідації роботів, використовуючи великомасштабну генерацію синтетичних даних.