Нейрочип AnIA прощается с фон Нейманом

15 июль, 2020 - 14:10Виталий Кобальчинский

С первых дней компьютерной эпохи и до нашего времени практически все вычисления производились процессорами, отделенными от памяти. В приложениях, интенсивно работающих с данными, на коммуникации между памятью и процессором может уходить больше времени, чем на сами вычисления.

Проблема сейчас актуальна как никогда по причине широкого распространения нейронных сетей, которые требуют большого числа перемножений векторов на матрицы. Использование для этого традиционных процессоров приводит к неоправданным затратам времени и энергии. Кроме того, обеспечиваемая ими цифровая точность в данном случае оказывается совершенно излишней: нейронные сети отлично работают если перемножения выполняются аналоговым способом с невысокой точностью.

Учесть все эти соображения постаралась группа исследователей из международного научно-производственного центра наноэлектроники и цифровых технологий imec в городе Лёвен (Бельгия). Разработанная ими архитектура Analog in Memory Computing (AiMC) свободна от «узкого места фон Неймана» (термин, введённый Тьюринговским лауреатом Джоном Бэкусом в 1977 г.), так как выполняет параллельные аналоговые вычисления непосредственно в ячейках статической оперативной памяти (SRAM).

На этой неделе imec вместе со своим промышленным партнёром в области машинного обучения — компанией GLOBALFOUNDRIES (GF), анонсировала аппаратную демонстрацию нового чипа для приложений искусственного интеллекта (ИИ), получившего название Analog Inference Accelerator (AnIA).

Устройство, построенное на архитектуре AiMC и платформе GF 22FDX, изготовлено на 300-мм технологической линии завода GF Fab 1 в г. Дрезден (Германия). 22FDX использует технологию полностью обеднённого кремния на изоляторе (FD-SOI) с детализацией 22 нм, чтобы обеспечивать выдающуюся производительность при рабочем напряжении до 0,5 В и сверхнизком токе статической утечки 1 пА/мкм.

AnIA показал исключительное снижение динамического потребления энергии при выполнении вычислений для соответствующим образом оптимизированных глубоких нейронных сетей. В тестовых испытаниях вычислительная эффективность чипа достигала 2900 тераопераций в секунду на 1 ватт энергии (TOPS/W). По этому показателю AnIA в 10-100 раз превосходит цифровые акселераторы, тем самым делая возможным локальное выполнение распознавания образов в миниатюрных датчиках и других устройствах границы, которые в настоящее время выгружают задачи машинного обучения на удалённые серверы ЦОД.

«Успешный запуск в производство AnIA знаменует важный шаг вперёд к валидации Analog in Memory Computing (AiMC), — утверждает Дидерик Веркест (Diederik Verkest), программный директор imec по машинному обучению. — Эти многообещающие результаты побуждают нас к дальнейшему развитию этой технологии с прицелом на 10 000 TOPS/W».