На ежегодной конференции NVIDIA по GPU-технологиям CEO NVIDIA Дженсен Хуанг объявил новую архитектуру графических процессоров NVIDIA Volta и серию аппаратно-программных решений, призванных ускорить и упростить работу с искусственным интеллектом. Первый процессор на базе Volta — это GPU для дата-центров Tesla V100.
В основе Volta, седьмого поколения графических архитектур NVIDIA, находится 21 млрд транзисторов. По оценкам компании, пиковая производительность Volta в 5 раз выше архитектуры предыдущего поколения Pascal и в 15 раз выше Maxwell, представленной два года назад.
Ключевые технологии GPU Tesla V100,которые позволили преодолеть 100-терафлопсный рубеж в задачах глубокого обучения:
Специализированные ядра Tensor, созданные для ускорения работы искусственного интеллекта. Оснащенный 640 ядрами Tensor, процессор V100 обеспечивает производительность 120 терафлопс в глубоком обучении, что эквивалентно производительности 100 CPU.
Новая архитектура GPU с более чем 21 млрд транзисторов объединяет ядра CUDA и Tensor в рамках унифицированной архитектуры, обеспечивая производительность суперкомпьютера для ИИ в одном GPU.
Пропускная способность нового поколения интерфейса NVLink между графическими процессорами и между графическим и центральным процессорами увеличилась вдвое по сравнению с предыдущим поколением NVLink.
Разработанная совместно с Samsung память 900 ГБ/с HBM2 DRAM увеличила полосу пропускания на 50% по сравнению с предыдущим поколением.
Ведущие фреймворки и приложения для ускорения ИИ и исследований могут взять на вооружение оптимизированное под Volta программное обеспечение, включая CUDA, cuDNN и TensorRT.