Стартап основателя Rambus бросил вызов Nvidia на рынке нейрочипов

7 ноябрь, 2018 - 17:54Виталий Кобальчинский

Flex Logix анонсировал новый дизайн чипа, с которым этот четырёхлетний стартап рассчитывает обеспечить себе решающее преимущество на полупроводниковом рынке ускорителей граничных приложений искусственного интеллекта.

«Я думаю, нейронные сети должны стать более крупным рынком, чем то, что мы делали с Rambus, — говорит Джефф Тейт (Geoff Tate), исполнительный директор Flex Logix. На переломе тысячелетий он оставил основанную им компанию Rambus, в надежде найти более значительное поле приложения своих способностей.

Стартап основателя Rambus бросил вызов Nvidia на рынке нейрочипов

Технологии Rambus сегодня занимают ключевое место в каждой выпускаемой микросхеме оперативной памяти DRAM, однако Тейт, по его словам, в конце-концов обнаружил свежее, никем не занятое направление микроэлектронного бизнеса с ещё более грандиозными перспективами. В 2014 г. в Калифорнийском университете Лос-Анджелеса он познакомился с Чен Ваном (Cheng Wang), Фанли Юанем (Fang-Li Yuan) и Деяном Марковичем (Dejan Markovic), разрабатывавшими новый вариант FPGA, и это стало началом Flex Logix.

Сам по себе рынок массивов программируемой логики давно поделен и соваться туда с еще одним чипом не имело смысла — такая бизнес-идея не имела шансов привлечь серьезных инвесторов. Основатели Flex Logix вместо этого решили сделать в мире FPGA примерно то же, что, на четверть века раньше, ARM сделала для индустрии микропроцессоров. Они сфокусировались на создании платформы (IP core), которая позволяла бы встраивать ядро FPGA в другие чипы.

Фактически, на высококонкурентном рынке полупроводниковой IP, поделенном такими компаниями как ARM, Cadence, Synopsys и (тогда ещё) Imagination Technologies на сегменты процессоров, памяти, скоростного ввода-вывода, они нашли место для нового востребованного сегмента ядер FPGA.

Целевыми приложениями для Flex Logix являлись прежде всего ASSP и микроконтроллеры — индустрия с оборотом более 80 млрд долл. Именно её игроки больше всего выигрывали от обеспечиваемой встраиваемым подходом экономии в стоимости и энергопотребления FPGA.

Стартап основателя Rambus бросил вызов Nvidia на рынке нейрочипов

Однако, за прошедшие с тех пор четыре года сформировался ещё более многообещающий рынок для технологий Flex Logix.

«Чипы нейросетей ожидает взрывной рост масштабов производства и сложности, — заявил Тейт в интервью на Осенней процессорной конференции, организованной в Санта-Клара аналитической фирмой Linley Group. — Если проводить аналогию с ранними днями x86, мы прямо сейчас находимся на стадии 286».

Более конкретно, компания нацеливается на нишу «граничных умозаключений» рынка ИИ. Сюда входят устройства за пределами ЦОД, предварительно обученные нейросети которых самостоятельно строят умозаключения и дают нужные ответы на вопросы. Именно такие граничные умозаключения помогают автономным машинам избегать препятствий, а IoT-камерам — находить знакомые лица в толпе.

По словам Тейта, для разработчиков таких устройств на первое место выходит не производительность нейрочипов, а их вычислительная эффективность: «... проблема не в том, как много тераопераций в секунду (TOPS) вы делаете, а в том сколько вы можете сделать на один ватт». В отличие от серверов в ЦОД, граничные устройства имеют конечный ресурс батарей, поэтому такие соображения актуальны для них.

Компания Тейта показала в Санта-Клара свою технологию NMAX, базирующуюся на ядре eFPGA. Она использует огромное количество идентичных логических элементов, умножителей-аккумуляторов (накапливающих сумматоров), которые выполняют фундаментальную для нейросетей операцию перемножения матриц. Высокоскоростными межсоединениями XFLX кластер логических элементов связан с памятью SRAM, служащей для хранения весовых коэффициентов нейросетей.

Такая реконфигурируемая организация вместе со специальным компилятором, оптимизирующим поток данных в чипе, позволяет обеспечить максимальную «занятость» умножителей-акумуляторов, своевременно снабжая их нужной информацией. Кроме того она может свести к минимуму или даже вовсе исключить использование дискретной памяти DRAM, а это означает снижение стоимости чипов и потребляемой ими энергии.

Стартап основателя Rambus бросил вызов Nvidia на рынке нейрочипов

На формальной презентации, Чен Ван, соучредитель-коллега Тейта, сообщил, что чип NMAX в десят раз превосходит по соотношению цена/производительность GPU Tesla T4 компании Nvidia. По его словам, в эталонных тестах на распознавание изображений, ResNet-50, эффективность NMAX достигала 87%, а у Tesla T4 и других подобных чипов она не превышала 25%.

«Мы не видели ничего, способного сравниться с нашим возможностями, — сказал Тейт. — На самом деле тесты ResNet-50 даже несколько вводят в заблуждение, потому что в реальном мире, в отличие от академических презентаций, нейронные сети будут намного крупнее, чем ResNet −50, и будут гораздо больше нагружать оборудование».

Со второй половины следующего года IP-ядро NMAX станет доступно для клиентов Flex Logix, которые смогут начать интегрировать его в разрабатываемые ими чипы.