Нейросети ускоряются

24 октябрь, 2017 - 17:06Тимур Ягофаров

В ключевом выступлении главы NVIDIA на конференции GTC 2017 Europe большое внимание было уделено ускорению работы нейросетей, которые становятся одной из ключевых технологий современного ИТ-мира.

Важность нейросетей связана с тем, что с их помощью эффективно решаются задачи, связанные с искусственным интеллектом (ИИ). Казалось бы, сфера применения ИИ довольно ограничена, но уже с помощью нескольких примеров возглавляющий NVIDIA Дженсен Хуанг показал, что это не так. Пожалуй, наиболее зрелищной из них была демонстрация рендеринга сцены с помощью трассировки лучей. Когда для половины изображения это выполнялось по классическому методу, а для второй задействовался ИИ. Благодаря чему скорость рисования значительно увеличилась, причем без потери качества.
Нейросети ускоряются
Аудитория конференций NVIDIA значительно расширилась, а сами они превратились в целую серию мероприятий, которые проходят в течение года на различных континентах

В своем выступлении Дженсен Хуанг привел интересную статистику, которая свидетельствует о взрывообразном росте интереса к ИИ в последние несколько лет. Так финансирование стартапов, работающих над темой ИИ, с 2012 по 2017 год выросло в 12 раз и достигло 6,6 млрд долл. А число опубликованных статей по тематике ИИ за последние три года увеличилось в 13 раз и достигло 3 тыс. Естественно, что NVIDIA уделяет этой технологии большое внимание, достаточно сказать, что в ее графических чипах имеется специализированный модуль для тензорных вычислений, которые активно применяются в рамках технологии ИИ.
Нейросети ускоряются
По заявлению главы NVIDIA, на сегодня свыше 1900 стартапов в области ИИ стоят свои решения на базе платформы инференса (inference – операция вывода) компании. Стоит коротко объяснить, что прежде чем нейросети смогут выдавать правильные результаты на основании имеющихся данных, их необходимо обучить. А функцию выдачи вывода уже обученной нейросети называют инференс. В своем докладе Дженсен Хуанг привел данные о сферах применения инференса NVIDIA, их список по мере уменьшения доли включает: ИТ-сервисы, автомобильную, здравоохранение, умные города, производство, дроны и финансовые сервисы. Как видим, тематика действительно обширная. И мы обязательно еще вернемся к обсуждению того, что же сегодня можно сделать на базе платформ ИИ, функционирующих на базе нейросетей. Этот вопрос мы обсуждали с экспертом NVIDIA, интервью с которым вскоре будет опубликовано.
Нейросети ускоряются
Вот такая платформа HGX, оснащенная восемью GPU Tesla V100, способна посоперничать со 160 серверами "на базе CPU"

Для ускорения работы нейросетей NVIDIA предлагает как собственные аппаратные платформы, так и специализированные библиотеки. На сцене GTC 2017 Europe состоялась демонстрация возможностей и того, и другого. В выступлении Дженсена Хуанга была показана функция распознавания экзотических цветов по их фото. Так вот при подключении обученной нейросети, которая была усилена библиотеками NVIDIA TensorRT 3, распознавание ускорилось на два порядка. По заявлению главы NVIDIA, при сочетании аппаратной платформы компании и ее пакета TensorRT 3, можно на порядок повысить эффективность ЦОД. Так например для достижения производительности 45 тыс. изображений в секунду в продемонстрированной на сцене задаче достаточно использовать платформу NVIDIA HGX, оснащенную восемью картами Tesla V100, с общим потреблением 3 кВт. Для достижения аналогичного показателя можно использовать также 160 серверов на базе традиционных CPU, потребляющих свыше 65 кВт. При этом цена решения NVIDIA составит 1/6, а места для его размещения необходимо всего лишь в стойке под шасси высотой 4U.
Нейросети ускоряются
Демонстрация распознавания изображений включила сравнение производительности в варианте TensorFlow на CPU...

По данным NVIDIA, пакет TensorRT 3 позволяет в 3,7 раза ускорить инференс на Tesla V100 (Volta) по сравнению с Tesla P100 (Pascal). А при сравнении TensorRT 3 со стандартной библиотекой TensorFlow ускорение составляет до 18 раз.

Нейросети ускоряются

... и TensorRT на GPU, в последнем рост оценивается на два порядка

Если же вернуться к демонстрации, организованной на сцене GTC 2017 Europe, то здесь на аппаратной платформе CPU с применением библиотеки TensorFlow была достигнута производительность 4,9 изображений в секунду. А при подключении TensorRT на базе GPU этот показатель вырос до 552,3.
Нейросети ускоряются