0 |
Дослідники зі Школи інженерії та прикладних наук Пенсільванії розробили перший програмований чіп, який може навчати нелінійні нейронні мережі за допомогою світла - це прорив, що може значно прискорити навчання штучного інтелекту, знизити споживання енергії та навіть прокласти шлях до створення комп'ютерів, які повністю працюють на світлі.
У той час як сучасні чипи штучного інтелекту є електронними та використовують електрику для виконання обчислень, новий чип є фотонним, тобто використовує промені світла. Описаний у журналі Nature Photonics, чип змінює поведінку світла, щоб виконувати нелінійну математику, що лежить в основі сучасного AI.
«Нелінійні функції дуже важливі для навчання глибоких нейронних мереж», - каже Лян Фен (Liang Feng), професор кафедри матеріалознавства та інженерії (MSE) і кафедри електротехніки та систем (ESE), старший автор статті. «Наша мета полягала в тому, щоб уперше реалізувати це у фотоніці».
Більшість систем штучного інтелекту сьогодні залежать від нейронних мереж - програмного забезпечення, розробленого для імітації біологічної нервової тканини. Подібно до того, як нейрони з'єднуються між собою, даючи змогу біологічним істотам мислити, нейронні мережі з'єднують шари простих одиниць, або «вузлів», даючи змогу системам AI виконувати складні завдання.
Як у штучних, так і в біологічних системах ці вузли «спрацьовують» тільки при досягненні певного порогу - нелінійний процес, що дає змогу невеликим змінам на вході спричиняти більші та складніші зміни на виході.
Тоді як багато дослідницьких груп, зокрема й у Penn Engineering, розробили чипи, що працюють від світла і здатні виконувати лінійні математичні операції, жодна з них не розв'язала задачу представлення нелінійних функцій за допомогою тільки світла - дотепер.
Прорив команди почався зі спеціального напівпровідникового матеріалу, який реагує на світло. Коли промінь «сигнального» світла (що несе вхідні дані) проходить через матеріал, другий промінь «накачування» світить зверху, змінюючи реакцію матеріалу.
Змінюючи форму та інтенсивність променя накачування, команда може контролювати поглинання, передачу або посилення сигнального світла залежно від його інтенсивності та поведінки матеріалу. Цей процес «програмує» чип на виконання різних нелінійних функцій.
«Ми не змінюємо структуру чипа», - каже Фенг. «Ми використовуємо саме світло для створення візерунків усередині матеріалу, який потім змінює форму руху світла через нього».
У результаті вийшла реконфігурована система, яка може виражати широкий спектр математичних функцій залежно від схеми накачування. Така гнучкість дає змогу чипу навчатися в режимі реального часу, коригуючи свою поведінку на основі зворотного зв'язку з виходом.
Щоб перевірити потенціал чипа, команда використовувала його для вирішення еталонних завдань AI. Платформа досягла понад 97% точності в простій нелінійній задачі про межі прийняття рішень і понад 96% у відомому наборі даних про кольори Iris - стандарті машинного навчання.
В обох випадках фотонний чип зрівнявся з традиційними цифровими нейронними мережами або перевершив їх, але при цьому використовував менше операцій і не потребував енергомістких електронних компонентів.
В одному з дивовижних результатів лише чотири нелінійних оптичних з'єднання на чипі були еквівалентні 20 лінійним електронним з'єднанням з фіксованими нелінійними функціями активації в традиційній моделі. Така ефективність натякає на те, що можливо при масштабуванні архітектури.
На відміну від попередніх фотонних систем, які фіксуються після виготовлення, чип Penn Engineering починається як чисте полотно. Накачувальне світло діє як пензель, малюючи перепрограмовані інструкції в матеріалі.
«Це справжній доказ концепції польового програмованого фотонного комп'ютера, що програмується в полі», - каже Фенг. «Це крок у майбутнє, де ми зможемо навчати AI зі швидкістю світла».
Хоча поточна робота зосереджена на поліномах - гнучкому сімействі функцій, які широко використовуються в машинному навчанні, - команда вважає, що в майбутньому їхній підхід може дати змогу виконувати ще потужніші операції, як-от експоненціальні або зворотні функції. Це відкриє шлях до створення фотонних систем для вирішення масштабних завдань, таких як навчання великих мовних моделей.
Замінюючи тепловидільну електроніку оптичними компонентами з низьким енергоспоживанням, платформа також обіцяє скоротити споживання енергії в центрах обробки даних AI, що потенційно може змінити економіку машинного навчання.
«Це може стати початком фотонних обчислень як серйозної альтернативи електроніці», - каже Лян. «Пенсільванія - батьківщина ENIAC, першого у світі цифрового комп'ютера, і цей чип може стати першим реальним кроком на шляху до фотонного ENIAC».
Це дослідження проводили у Школі інженерних і прикладних наук Пенсільванського університету за підтримки Агентства перспективних оборонних дослідницьких проєктів (DARPA) (W911NF-21-1-0340), Управління військово-морських досліджень (ONR) (N00014-23-1-2882) і Національного наукового фонду (NSF) (ECCS-2023780, ECCS-2425529, DRM-2326699, PHYS-1847240, DMR-2326698).
Kingston повертається у «вищу лігу» серверних NVMe SSD
0 |