NVIDIA BlueField-4 STX — революційна архітектура зберігання даних для ери агентного AI

18 март, 2026 - 09:35

NVIDIA BlueField-4 STX — революційна архітектура зберігання даних для ери агентного AI

Компанія NVIDIA представила NVIDIA BlueField-4 STX — модульну референсну архітектуру, яка дозволяє підприємствам та хмарним провайдерам розгортати прискорену інфраструктуру зберігання даних. Головна мета новинки — забезпечити «міркування у довгому контексті» (long-context reasoning), яке є життєво необхідним для роботи сучасного агентного AI.

Традиційні дата-центри добре справляються з великими обсягами даних, але вони занадто повільні для миттєвої взаємодії з AI-агентами. Агентний AI працює через безліч кроків, інструментів та сесій, що вимагає доступу до даних у реальному часі та величезної контекстної робочої пам'яті, щоб розмови та завдання залишалися швидкими та логічними.

Зі зростанням обсягу контексту звичайні шляхи передачі даних уповільнюють інференс (виконання моделей) та знижують завантаження дорогих GPU. NVIDIA STX розв'язує цю проблему, тримаючи дані максимально близько до обчислювальних ядер.

Ключовим елементом нової архітектури є платформа NVIDIA CMX (контекстна пам'ять). Вона фактично розширює пам'ять GPU за допомогою високопродуктивного шару зберігання контексту.

В результаті досягається до 5 разів більше токенів на секунду порівняно з традиційними системами зберігання.

«Агентний AI переосмислює можливості програмного забезпечення — і обчислювальна інфраструктура повинна докорінно змінитись, щоб встигати за цим темпом. STX надає модульну основу для AI-нативної інфраструктури, що дозволяє "AI-фабрикам" працювати на піку продуктивності», — зазначив Дженсен Хуанг (Jensen Huang), засновник і CEO NVIDIA.

Архітектура STX базується на новітній платформі NVIDIA Vera Rubin та використовує процесор BlueField-4, що поєднує CPU Vera та SuperNIC ConnectX-9. Мережа — Spectrum-X Ethernet. Це дає у 4 рази вищу енергоефективність та у 2 рази швидше завантаження сторінок даних порівняно з традиційними CPU-архітектурами.

Проєкт вже отримав підтримку від лідерів ринку. У сфері розробки систем — це Cloudian, Dell Technologies, HPE, IBM, NetApp, Nutanix, VAST Data та WEKA. У виробництві — Supermicro, AIC та Quanta Cloud Technology (QCT). Впровадження у хмарах планують CoreWeave, Lambda, Mistral AI, Nebius та OCI.

Платформи на базі STX з’являться у партнерів вже у другій половині 2026 року.