NVIDIA представила ускоритель для ЦОДов Tesla P100

21 июня 2016 г., 14:35

NVIDIA представила ускоритель для дата-центров Tesla P100

По заявлению NVIDIA, представленное компанией новейшее решение для платформы ускоренных вычислений Tesla P100 позволяет создавать новый класс серверных платформ с производительностью уровня нескольких сотен классических серверов на базе CPU. Ускоритель Tesla P100 основан на новой архитектуре NVIDIA Pascal, в которой реализовано несколько технологических нововведений, что по оценкам NVIDIA, позволило повысить скорость обучений нейронных сетей в 12 раз по сравнению с решениями на базе архитектуры прошлого поколения NVIDIA Maxwell. Для Tesla P100 заявлена скорость вычислений двойной точности — 5.3 терафлопс, одинарной точности — 10.6 терафлопс и половинной точности — 21.2 терафлопс, с технологией NVIDIA GPU BOOST.

Среди реализованных в архитектуре Pascal нововведений в первую очередь стоит отметить NVIDIA NVLink — высокоскоростной интерфейс для связи между несколькими графическими процессорами, распределяющий нагрузку между GPU. С его помощью, по заявлению компании, удается увеличить пропускную способность в 5 раз по сравнению с лучшими на сегодня решениями в данном классе. NVLink позволяет связать до восьми GPU Tesla P100, максимально повышая производительность в узле. IBM уже внедрила NVLink в свои процессоры POWER8 для высокоскоростной коммуникации между CPU и GPU.

Графические процессоры Pascal выпускаются на базе техпроцесса 16нм FinFET с использованием 15,3 млрд. транзисторов, являясь крупнейшим в мире FinFET чипом. Кроме того, архитектура Pascal объединяет процессор и данные в одном пакете, чтобы максимально повысить эффективность вычислений. В ней реализован подход к строению памяти по принципу Chip-on-Wafer-on-Substrate (CoWoS) с HBM2. Заявлено, что это повышает пропускную способность памяти до 720 ГБ/с (в 3 раза по сравнению с архитектурой Maxwell).

А с помощью новых инструкций половинной точности удалось обеспечить пиковую производительность свыше 21 терафлопса в задачах глубокого обучения.

Проведенные NVIDIA исследования показали, что приложение молекулярной динамики AMBER на одном серверном узле с графическими процессорами Tesla P100 выполняется быстрее, чем на 48 двухсокетных серверных узлах. Для обучения популярной глубокой нейронной сети AlexNet потребуется 250 двухсокетных серверных узлов, чтобы достичь производительности восьми GPU Tesla P100. А популярное приложение прогнозирования погоды COSMO работает быстрее на восьми GPU Tesla P100, чем на 27 двухсокетных серверах.

NVIDIA также анонсировала ряд обновлений в платформе разработки для GPU-вычислений NVIDIA SDK. В их число входит NVIDIA CUDA 8 — новейшая версия платформы параллельных вычислений NVIDIA, которая представляет разработчикам прямой доступ к новым возможностям Pascal, включая унифицированную память и NVLink. Кроме того, в актуальный релиз входит библиотека анализа графов nvGRAPH, которую можно использовать для расчета траекторий, информационной безопасности и анализа логистики, что включает в сферу применения GPU-ускоренных вычислений аналитику Big Data.

NVIDIA также анонсировала cuDNN версии 5, GPU-ускоряемую библиотеку примитивов для сетей глубокого обучения. cuDNN 5 включает поддержку GPU Pascal, ускорение рекуррентных нейронных сетей, используемых для видео и других последовательных данных, а также ряд улучшений, предназначенных для использования в медицинской, нефтегазовой и других областях промышленности. cuDNN ускоряет работу ведущих фреймворков глубокого обучения, включая TensorFlow от Google, Caffe от Университета Беркли, Theano от Университета Монреаля и Torch от Нью-Йоркского Университета, которые, в свою очередь, находятся в основе решений от Amazon, Facebook, Google и других компаний.

Графические ускорители NVIDIA Tesla P100 на базе архитектуры Pascal появятся в составе новой системы глубокого обучения NVIDIA DGX-1 в июне. Также ожидается, что новый процессор появится в составе серверов от ведущих производителей в начале 2017 года.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365