Big Basin — новое поколение GPU-серверов Facebook

9 март, 2017 - 16:15
Big Basin — новое поколение GPU-серверов Facebook

На конференции 2017 Open Compute Project (OCP) компания Facebook представила четыре новых вида оборудования для датацентров, и в том числе Big Basin — серверный модуль с восемью графическими процессорами (GPU), оптимальный для приложений искусственного интеллекта (ИИ).

Big Basin является развитием первого GPU-сервера Facebook под кодовым именем Big Sur, который компания выпустила в 2015 г., и использует новое поколение GPU.

«У Big Sur материнская плата была смонтирована в общем корпусе с разъёмами PCIe для восьми графических карт, — рассказал в интервью Эран Тал (Eran Tal), менеджер Facebook по инженерным проектам. — Большое отличие Big Basin заключается в том, что мы вынесли материнскую плату наружу... Нам был нужен головной узел, чтобы увеличить пропускную способность ввода-вывода...». Удалив системную плату разработчики смогли также укоротить модуль — он занимает три отсека стойки (RU) вместо четырёх.

Big Basin может работать в общей стойке с ещё одной новинкой Facebook, Tioga Pass — следующей итерацией сервера Leopard. Использование этих машин вместо Big Sur, по словам Тала, позволило Facebook увеличить размер обучаемых моделей на 30% (за счёт увеличения производительности GPU с 7 до 10,6 терафлопс и памяти — с 12 до 16 ГБ) и обеспечить 100-процентное улучшение результата прохождения популярного теста классификации изображений, ResNet-50.

Компания также показала вторую версию своего сервера Yosemite и модификацию сервера хранения Open Vault (Knox), получившую наименование Bryce Canyon.

Вся документация на представленное оборудование, доступна на ресурсе Open Compute Project. Facebook учредила OCP в 2011 г.

Одновременно с Facebook, Microsoft анонсировала спроектированное при участии Nvidia серверное шасси HGX-1 с посадочными местами для восьми GPU.