Решения NVIDIA ускоряют 8 из 10 самых мощных суперкомпьютеров мира

24 июнь, 2020 - 10:05

В опубликованном новом рейтинге суперкомпьютеров TOP500 в 8 из 10 ведущих суперкомпьютеров мира установлены графические процессоры NVIDIA и/или решения InfiniBand. В их число входят самые мощные системы США, Европы и Китая.

Решения NVIDIA, теперь совместно с решениями Mellanox, находятся в основе в основе 2/3 обновленного списка TOP500 (333 системы), что существенно превышает результаты 2017 года (203 системы с технологиями NVIDIA и/или Mellanox).

Почти три четверти (74%) новых систем с InfiniBand из данного списка оснащены коммутаторами NVIDIA Mellanox HDR 200G InfiniBand, что говорит о все большей важности быстрого обмена данными внутри вычислительных систем. Число систем TOP500 с коммутаторами HDR InfiniBand почти удвоилось с ноября 2019 года. Технология InfiniBand сегодня используется в 141 суперкомпьютере из данного списка, что на 12% больше, чем в июне 2019 года. Адаптеры NVIDIA Mellanox InfiniBand и Ethernet установлены в 305 системах (61%) из списка TOP500, включая 141 систему InfiniBand и 164 (63%) системы с Ethernet-соединениями.

С точки зрения энергоэффективности платформы на графических процессорах NVIDIA в среднем в 2.8 раза эффективнее систем без GPU NVIDIA, при замере в гигафлопсах/Вт.

Это одна из причин, почему графические процессоры NVIDIA сегодня установлены в 20 из 25 ведущих суперкомпьютеров TOP500.

Среди наиболее энергоэффективных оказалась система Selene, недавно ставшая частью вычислительного кластера NVIDIA. Она заняла вторую строчку в рейтинге Green500 и седьмую в TOP500 с результатом 27.5 петафлопсов в бенчмарке Linpack. С эффективностью в 20.5 гигафлопс/Вт Selene незначительно отстает от лидера списка Green500. Ее опередила гораздо меньшая по вычислительным возможностям система, занимающая по производительности 394 место.

Selene — это единственная система в Top 100, которой удалось взять барьер в 20 гигафлопсах на Ватт. Кроме того, это второй по мощности индустриальный суперкомпьютер в мире, уступающий место только системе № 6 от итальянского гиганта энергоиндустрии Eni S.p.A., построенной также на базе графических процессоров NVIDIA.

С точки зрения энергопотребления Selene в 6.8 раза экономичнее средней системы TOP500, не оснащенной GPU NVIDIA. Это стало возможным благодаря тензорным ядрам третьего поколения в GPU NVIDIA A100, которые ускоряют традиционные 64-битные математические операции в моделировании и вычисления пониженной точности для ИИ.

Конфигурация Selene включает:

280 систем DGX A100.
2240 GPU NVIDIA A100.
494 коммутатора NVIDIA Mellanox Quantum 200G InfiniBand.
56 ТБ/с в соединениях.
7 ПБ высокоскоростной флэш-памяти.

Для Selene заявлена производительность в ИИ-задачах свыше 1 экзафлопса. Кроме того, Selene установила новый рекорд при использовании всего 16 из всех ее систем DGX A100 в главном бенчмарке анализа данных TPCx-BB, показав результаты в 20 раз лучше любой другой системы.

Сообщается, что в настоящий момент строятся еще шесть систем на базе анонсированных в прошлом месяце GPU A100. Одна из таких систем находится в Аргонской национальной лаборатории, где исследователи применят кластер из 24 систем NVIDIA DGX A100 для сканирования миллиардов лекарств с целью создания лекарства против COVID-19.

«Большую часть этой работы сложно смоделировать на компьютере, поэтому мы использовали ИИ, чтобы определить, где и когда брать следующие образцы», — говорит Арвинд Раманатан (Arvind Ramanathan), специалист по вычислительной биологии из Аргонской лаборатории, в отчете по первым пользователям GPU A100.

Научно-исследовательский центр NERSC применяет ИИ в нескольких проектах на системе Perlmutter с 6200 GPU A100. Один из проектов предполагает использование обучения с подкреплением для управления экспериментами с источниками света, в другом генеративные модели будут применяться для воссоздания дорогих симуляций в ФВЭ-детекторах.

Ученые из Мюнхена обучают модели естественного языка на 6000 GPU в суперкомпьютере Summit для ускорения анализа белков коронавируса. Это еще одно подтверждение того, что системы TOP500 выходят за рамки традиционных процессов моделирования с операциями двойной точности.

По мере того, как исследователи обращаются к глубокому обучению и анализу данных, они также прибегают к облачным сервисам и стримингу данных с удаленных платформ на Edge-устройства сети. Вместе эти элементы формируют четыре направления современных научных вычислений, которые ускоряет NVIDIA:

Симуляции: В борьбе с COVID-19 исследователи из Окриджской национальной лаборатории моделируют свыше 2 млрд химических соединений в сутки в AutoDock на GPU суперкомпьютера Summit.
ИИ и анализ данных: GPU-ускорение для Spark 3.0 обеспечивает более высокую производительность критически важной и трудоемкой клиентской части конвейера машинного обучения.
Периферийный стриминг в науке: ЦЕРН недавно заявил, что GPU NVIDIA в 500 раз сократят объемы данных, получаемых при столкновении частиц в Большом адронном коллайдере.
Визуализация: ПО NVIDIA IndeX и Magnum IO помогает в визуализации данных с аппарата Mars Lander — самой крупной в мире интерактивной объемной визуализации реального времени.