Google применила ИИ для оптимизации архитектуры чипов

1 март, 2021 - 15:25

Год назад директор Google Brain, Джефф Дин (Jeff Dean), заявил на Международной конференции ISSC, что модели глубокого обучения могут принимать более правильные решения о компоновке микрочипов, чем люди.

В феврале в статье, размещенной на допечатном сервере arXiv, Google представила исследовательский проект под названием Apollo, который далеко выходит за рамки того, на что намекал Дин в прошлом году. Apollo не просто выполняет разводку микросхемы, эта ИИ-программа впервые исследует возможные архитектуры микросхемы (дизайн функциональных элементов чипа), а вдобавок, постоянно улучшает эффективность работы, перенося в новые задачи опыт, накопленный при оптимизации других микросхем.

Чипы, которые Apollo помогает улучшать, относятся к классу ускорителей вычислений искусственного интеллекта. Соответственно, исследуемые архитектуры подходят для работы нейронных сетей с множеством простых математических единиц, которые выполняют умножение матриц и суммируют результаты.

Исследователи выбрали довольно простую задачу, свёрточную нейросеть под названием MobileNet, и протестировали рабочие нагрузки с использованием нескольких сетей собственной разработки для обнаружения объектов и семантической сегментации. Задача оптимизации заключалась в переборе более 452 млн параметров, и включала в себя определение наилучшего количества математических единиц (процессорных элементов) для данной модели.

Сильной стороной Apollo является сравнение различных существующих методов оптимизации, предоставляющая возможность видеть, как они сочетаются с оптимизацией архитектуры новой конструкции чипа для конкретных рабочих нагрузок. Авторы также установили, что Apollo позволяет улучшать сами методы оптимизации, «скармливая» им лучшие результаты применения других оптимизационных подходов.

Беркин Акин (Berkin Akin), который помогал разработать версию MobileNet, MobileNet Edge, также указал, что, Apollo действительно позволяет находить лучшую аппаратную архитектуру для отдельных видов рабочих нагрузок, однако ведущиеся сейчас исследования в области совместной оптимизация аппаратного дизайна чипа и архитектуры нейронной сети могут обернуться гораздо более весомыми преимуществами в будущем.