| 0 |
|
Інженери зі Стенфордського університету, Університету Карнегі-Меллон, Пенсільванського університету та Массачусетського технологічного інституту (MIT) у співпраці зі SkyWater Technology розробили новий багатошаровий комп’ютерний чип. Його архітектура може провістити нову еру апаратного забезпечення AI.
На відміну від сьогоднішніх здебільшого плоских, 2D-чипів, ключові ультратонкі компоненти нового прототипу розташовані вертикально, наче поверхи у висотній будівлі. Вертикальна проводка діє як численні високошвидкісні ліфти, що забезпечують швидке та масивне переміщення даних. Його рекордна щільність вертикальних з'єднань і ретельно переплетена суміш пам'яті та обчислювальних блоків допомагають чипу обійти "вузькі місця", які довго сповільнювали прогрес у плоских конструкціях. У апаратних тестах і симуляціях новий 3D-чип перевершує 2D-чипи приблизно на порядок.
Хоча академічні лабораторії раніше створювали експериментальні 3D-чипи, це перший випадок, коли такий чип показав явний приріст продуктивності та був виготовлений на комерційній фабриці.
«Це відкриває двері для нової ери виробництва та інновацій чипів», — сказав Субхасіш Мітра (Subhasish Mitra), професор електротехніки та комп’ютерних наук Стенфордського університету, і головний дослідник нової статті, представленої на 71-й щорічній нараді IEEE International Electron Devices Meeting (IEDM). «Такі прориви, як цей, дозволять нам досягти 1000-кратного покращення продуктивності обладнання, чого вимагатимуть майбутні системи AI».
Сучасні моделі AI, такі як ChatGPT і Claude, повинні переміщувати величезні обсяги даних між пам’яттю, яка зберігає інформацію, та обчислювальними блоками, які її обробляють.
На звичайних 2D-чипах компоненти розташовані на одній плоскій поверхні з обмеженою, розсіяною пам'яттю, тому дані мають проходити кількома довгими, перевантаженими маршрутами. Оскільки обчислювальні елементи працюють набагато швидше, ніж можуть рухатися дані (і оскільки чип не може зберігати достатньо пам’яті поблизу), система постійно чекає на інформацію. Інженери називають це "вузьке місце" «стіною пам’яті» (memory wall) — точкою, де швидкість обробки випереджає здатність чипа доставляти дані.
Протягом десятиліть виробники чипів боролися зі «стіною пам’яті», зменшуючи транзистори та розміщуючи їх більше на кожному чипі. Але ця стратегія також наближається до жорстких фізичних обмежень, які дослідники називають «стіною мініатюризації» (miniaturization wall).
«Такі прориви, як цей, дозволять нам досягти 1000-кратного покращення продуктивності обладнання, чого вимагатимуть майбутні системи AI», — зазначив Субхасіш Мітра.
Новий чип долає ці стіни, буквально підіймаючись над ними. «Інтегруючи пам’ять та обчислення вертикально, ми можемо переміщувати набагато більше інформації значно швидше, так само як ліфтові банки у висотці дозволяють багатьом мешканцям переміщатися між поверхами одночасно», — сказав Татхагата Срімані (Tathagata Srimani), доцент Університету Карнегі-Меллон, старший автор статті.
«Стіна пам’яті та стіна мініатюризації утворюють смертельну комбінацію», — додав Роберт М. Редвей (Robert M. Radway), доцент Пенсільванського університету. «Ми атакували її лоб у лоб, тісно інтегрувавши пам’ять і логіку, а потім розбудовуючи чип вгору з надзвичайно високою щільністю. Це як Манхеттен обчислень — ми можемо розмістити більше людей на меншій площі».
Досі більшість спроб створення 3D-чипів покладалися на складання окремих чипів. Цей підхід працює, але з’єднання між шарами є грубими, розрідженими та схильними до виникнення «вузьких місць».
Замість того щоб виготовляти окремі чипи, а потім з’єднувати їх, команда створює кожен шар безпосередньо поверх попереднього в рамках одного безперервного процесу («монолітний» метод). Цей монолітний метод використовує досить низькі температури, щоб уникнути пошкодження нижньої частини схеми, що дозволяє дослідникам щільніше укладати компоненти та набагато щільніше їх з’єднувати.
Що ще важливіше, процес був повністю завершений на вітчизняній комерційній кремнієвій фабриці. «Перетворення передової академічної концепції на щось, що може створити комерційна фабрика, є величезним викликом, — підкреслив Марк Нельсон (Mark Nelson), віцепрезидент SkyWater Technology. — Це показує, що ці передові архітектури можливі не тільки в лабораторії — їх можна виробляти всередині країни, у масштабі, що необхідно Америці для збереження лідерства в інноваціях напівпровідників».
Ранні апаратні тести показують, що прототип уже перевершує порівнянні 2D-чипи приблизно в чотири рази. Симуляції вищих, майбутніх версій — з більшою кількістю складених шарів пам'яті та обчислень — вказують на ще більші переваги. Дизайни з додатковими рівнями показують до дванадцяти-кратного покращення у реальних робочих навантаженнях AI, включно з тими, що походять від моделі LLaMA з відкритим кодом від Meta.
Найбільш вражає те, що, за словами дослідників, ця конструкція відкриває реалістичний шлях до 100- до 1000-кратного покращення показника «добутку енергії на затримку» (EDP) — ключового показника, який збалансовує швидкість та енергоефективність. Різко скорочуючи переміщення даних і додаючи набагато більше вертикальних шляхів, чип може досягти як вищої пропускної здатності, так і нижчого енергоспоживання на операцію.
Дослідники наголошують, що довгострокове значення цього дослідження виходить за рамки продуктивності. Довівши, що монолітні 3D-чипи можуть бути побудовані на території США, ця робота створює план для нової ери вітчизняних інновацій у сфері апаратного забезпечення.
Стратегія охолодження ЦОД для епохи AI
| 0 |
|

