+22 голоса |
Nvidia представила нову архітектуру графічних процесорів Blackwell на своєму заході GTC 2024. При цьому заявлено, що презентована платформа заснована на шести нових трансформаційних технологіях.
Зазначається, що з новими графічними процесорами Blackwell компанії зможуть запускати генеративний АІ в реальному часі на основі більш широких мовних моделей з 1 трильйоном параметрів. І це при дивовижному зниженні вартості та енергоспоживання у 25 разів у порівнянні з наявними графічними процесорами Nvidia H100, заснованими на архітектурі Grace Hopper.
Окрім прискорення генеративного АІ, Nvidia пообіцяла, що архітектура Blackwell відкриє нові можливості для прориву в обробці даних, інженерному моделюванні, автоматизації електронного проєктування, комп'ютерного дизайну ліків та квантових обчислень.
Архітектура Blackwell названа на честь Девіда Гарольда Блеквелла (David Harold Blackwell), відомого американського математика, який зробив значний внесок у такі галузі, як теорія ігор, теорія ймовірностей, теорія інформації та статистика.
До переліку нових технологій Blackwell входить техпроцес 4 нм виробництва чипів від TSMC. Він буде в основі графічного процесора наступного покоління, в якому використовуються дві графічні матриці, з'єднані між собою 10-терабайтним каналом.
Також новою є технологія Transformer Engine другого покоління від Nvidia, яка додає підтримку масштабування мікротензорів та алгоритми управління динамічним діапазоном, інтегровані в фреймворки Nvidia TensorTT-LLM та NeMo Megatron.
Чипи підтримують мережевий комутатор п'ятого покоління NVLink, що забезпечує до 1,8 терабіта на секунду двонапрямної пропускної здатності на GPU. Це забезпечує швидший зв'язок між 576 графічними процесорами в одному вузлі, що дозволяє створювати складніші LLM, ніж раніше.
Крім того, графічні процесори Blackwell стануть першими чипами, які матимуть спеціальний рушій для забезпечення надійності, доступності та зручності обслуговування, завдяки включенню нового RAS Engine. Вони також додають нові можливості на рівні чипа для підтримки профілактичного обслуговування на основі штучного інтелекту, покращуючи діагностику та надійність.
Blackwell також представить більш просунуті можливості конфіденційних обчислень для захисту моделей АІ та даних, а це означає, що вони стають більш реалістичною пропозицією в галузях, орієнтованих на конфіденційність, таких як охорона здоров'я та фінансові послуги.
Нарешті, Nvidia представила новий Decompression Engine, призначений для прискорення запитів до баз даних для моделей АІ.
Нова архітектура лежить в основі нового суперчіпа GB200 Grace Blackwell, який об'єднує два графічних процесори Nvidia B200 Tensor Core з центральним чипом Nvidia Grace через потужний інтерконектор NVLink з пропускною здатністю 900 гігабітів/с і низьким енергоспоживанням.
GB200 Grace Blackwell також оснащений новітніми мережевими комутаторами Nvidia Quantum-X800 InfiniBand. Останні вважаються першою мережевою платформою, яка може досягти пропускної здатності 800 гігабітів/с, що дозволить розширити межі АІ та інших високопродуктивних обчислювальних робочих навантажень шляхом об'єднання більшої кількості графічних процесорів разом.
Гілад Шайнер (Gilad Shainer), старший віцепрезидент Nvidia з мережевих технологій, сказав, що комутатори Nvidia X800 дозволять створити перші в історії генеративні моделі АІ з трильйонами параметрів, коли вони стануть доступними на Microsoft Azure, Oracle Cloud Infrastructure та інших платформах.
Компанія пояснила, що суперчіпи GB200 Grace Blackwell стануть ключовим компонентом її нової платформи Nvidia SuperPOD DGX GB2000 NVL72, яка являє собою багатовузлову стійку з рідинним охолодженням для інтенсивних обчислювальних навантажень. Вона об'єднуватиме до 36 суперчіпів Grace Blackwell GB200, включаючи 72 графічних процесори Blackwell і 36 центральних процесорів Grace, а також блоки обробки даних BlueField-3.
Це дозволяє їм працювати так, ніби вони є одним більш потужним графічним процесором з продуктивністю АІ до 1,4 екзафлопс і 30 терабайтами швидкої пам'яті. Загалом, це дозволить збільшити продуктивність у 30 разів порівняно з платформами попереднього покоління, заснованими на наявній архітектурі Nvidia H100 Tensor Core GPU.
Очікується, що новітній Nvidia DGX SuperPOD вийде на ринок наприкінці цього року, але до цього буде надано доступ до рішення через хмарні рішення.
Про DCIM у забезпеченні успішної роботи ІТ-директора
+22 голоса |