HPC Day 2013: суперкомпьютеры выходят за стены лабораторий

Восьмая по счету ежегодная конференция по высокопроизводительным вычислениям HPC Day прошла на базе НТУУ «КПИ». Она была посвящена технологиям, аппаратному и программному обеспечению для построения мощных вычислительных кластеров и суперкомпьютеров, GRID, а также инфраструктуре для поддержания их непрерывной работы. В конференции приняли участие более 300 специалистов, а всего за последние семь лет их количество превысило 2000 человек.

Несмотря на присутствие в названии слова «день» конференция продолжалась два дня. Первый был посвящен практическим семинарам. Так, в частности, тренер из научно-образовательного центра Applied Parallel Computing Александр Шевченко познакомил слушателей с особенностями параллельных вычислений NVIDIA CUDA версии 5.5, которая позволяет использовать вычислительную мощность современных графических процессоров. Они также узнали, как можно эффективно применить новшества версии для параллельного программирования современных аппаратных графических ускорителей TESLA, и об особенностях обновленного инструментария Nsight Visual Studio Edition 3.1. Директор по продуктам Дмитрий Ткачев из Massive Solutions, Чехия, рассказал, как с помощью современных интерфейсов связи InfiniBand FDR 56 Gbps можно значительно улучшить функционирование облачной инфраструктуры, обеспечивая в пять и более раз выше скорость передачи данных между серверами и значительно более низкие задержки, по сравнению с технологией 10 GbE.

HPC Day 2013 суперкомпьютеры выходят за стены лабораторий

Филиппе Траутманн: «По данным отчета IDC, во II квартале 2013 г. НР занимала первую позицию на рынке НРС-систем с долей 30,9%»

Во второй день состоялись технологические презентации. Сессия открылась докладом директора по продажам HPC-систем в регионе EMEA Филиппе Траутманна (Philippe Trautmann) об изменениях в мире вычислений, которые он охарактеризовал «олимпийским» девизом: быстрее, проще, надежнее. Прежде всего докладчик отметил выход высокопроизводительных вычислений из академических кругов в сектор реальной индустрии и широту их распространения. Вот лишь далеко не полный список областей их применения – это биология, геофизика, метеорология, научные исследования, военные разработки. Наиболее крупным заказчиком HPC-систем является нефтегазовая индустрия. Здесь стоимость эксплуатации месторождений настолько высока, что приобретение дорогостоящих суперкомпьютеров для симуляции процессов является вполне оправданным. В их число входят также такие организации, как DARPA и ФБР. По словам докладчика, один из заказчиков НР из Министерства обороны США использует приложение, требующее такого количества стоек с серверами, что для их размещения необходима половина футбольного поля.

Как поставщик высокопроизводительных систем НР не просто производит оборудование. Компания предлагает заказчикам предварительно интегрированные и протестированные вычислительные комплексы с оптимизированным ПО, которые готовы к запуску. Кроме этого, НР может поставлять системы, сделанные на заказ и оптимизированные для определенных задач. Они могут оснащаться высокопроизводительными каналами межкомпонентной связи FDR/QDR InfiniBand или 10/40 GbE, ускорителями на базе графических процессоров NVIDIA или Intel. Докладчик также обратил внимание аудитории на HP Moonshot – первый в мире программно-определяемый сервер для веб-приложений. Благодаря усовершенствованной архитектуре HP Moonshot провайдеры могут предлагать большее число услуг, используя при этом меньшие площади под оборудование и меньшее количество электроэнергии, одновременно сокращая затраты и снижая сложность.

Каково же сегодня позиционирование НР на рынке высокопроизводительных вычислений? По данным отчета IDC, во II квартале 2013 г. компания занимала первую позицию на рынке НРС-систем с долей 30,9%. В списке Top500 самых быстрых суперкомпьютеров на июнь 2013 г. девять систем НР вошли в первую сотню. Всего же компания поставила 190 систем, заняв первую позицию в этой номинации.

Далее Филиппе Траутманн представил основные семейства серверов, поставляемых НР на рынок. Прежде всего, это ProLiant BL – лезвийное решение, готовое для запуска облачных сервисов. Оно предназначено для бизнес-критических приложений, требующих для своей работы НРС-систем. При необходимости обеспечить гибкую конфигурацию высокопроизводительной вычислительной системы компания предлагает многоцелевые стоечные серверы семейства ProLiant DL. Для построения крупных ЦОД можно использовать специально разработанное для этой цели семейство серверов ProLiant SL. Они характеризуются высокими уровнями масштабируемости, эффективности и плотности. Наконец, уже упоминавшийся выше сервер НР ProLiant Moonshot, на котором остановимся чуть подробнее.

По заявлению компании, шасси Moonshot 1500 спроектировано с учетом быстрого внедрения инноваций и расширения возможностей масштабирования. Оно предназначено для серверов, работающих с микросхемами мобильных устройств, включает, в частности, сетевые интерфейсы, дисковые накопители с прямым подключением и два сетевых коммутатора. При этом используются общие средства управления. Сервер оснащается процессором Intel Atom S1260, что обеспечивает оптимальную производительность при низком энергопотреблении. В шасси устанавливается до 45 серверов, каждый из которых можно адаптировать к определенной рабочей нагрузке.

Еще одно интересное семейство продуктов – Performance Optimized Datacenter (POD), мобильные ЦОД, разработанные на базе индустриально-стандартных технологий. Поддерживаются как различные технологии НР, так и сторонних производителей, что расширяет возможности выбора технологической среды. Заказчику предоставляется широкий набор конфигураций, оптимизированных по энергопотреблению или по масштабируемости, в зависимости от его бизнес-потребностей или инфраструктурных возможностей. К примеру, в стандартный контейнер длиной 12 м можно установить более чем 3,5 тыс. вычислительных узлов или 12 тыс. жестких дисков LFF.

В заключение своего выступления докладчик привел ряд примеров НРС-систем на базе продуктов НР. Это быстрейший в университетской среде суперкомпьютер Conte в Университете Пердью, США (#28 в списке Top500, пиковая производительность 1,635 PFLOPS), самый «зеленый» Tsubame 2.0 в Токийском технологическом институте (#4 в списке Top500, пиковая производительность 2,4 PFLOPS) и ряд других.

Владислав Михайлюк: «iWARP устраняет три основных источника задержек: TCP/IP-транспорт, промежуточную буферизацию и переключатели контекста приложений, что позволяет использовать Ethernet для внутренней сети кластеров»

Очевидно, для построения высокопроизводительных вычислительных кластеров необходимы соответствующие сетевые технологии, объединяющие узлы. О том, что в этой области предлагает НР, рассказал специалист из бизнес-подразделения HP Networking Владислав Михайлюк.

Внутренняя сеть НРС-кластера должна удовлетворять двум основным требованиям: высокой пропускной способности и как можно более низким сквозным задержкам. Для решения этих задач был разработан ряд технологий, одной из которых является InfiniBand. Однако привлекательным является использование Ethernet для межузловых связей, что позволяет иметь однородную сеть как внутри, так и снаружи. Сегодня скорость передачи данных Ethernet позволяет удовлетворить первому требованию, однако проблема задержек, связанная с особенностями стека протоколов, осталась. Поэтому в 2002 г. RDMA Consortium разработал протокол iWARP (Internet Wide Area RDMA Protocol), расширяющий возможности TCP/IP. Он устранял три основных источника задержек: TCP/IP-транспорт, промежуточную буферизацию и переключатели контекста приложений, которые все вместе составляли почти 100% нагрузки на сетевые операции процессора. Эти функции передавались сетевой карте.

Кроме разгрузки процессора, НР предлагает также упростить архитектуру сети с помощью IRF (Intelligent Resilient Framework) – инновационной технологии виртуализации коммутационной платформы. Она позволяет объединить несколько физических устройств в одно логическое, удалить уровень агрегации и обеспечить более простую связь между пользователями и сетевыми ресурсами.

Далее докладчик представил ряд продуктов компании – это коммутаторы уровня доступа серий НР 5900/5800 и для ядра сети – серий 12000/11000. Коммутаторы ядра сети и серии 5900 работают под управлением модульной ОС Comware V7, которая предоставляет функциональность сетей SDN.

Дмитрий Конягин: «Сегодня уже никто не сомневается в том, будущие высокопроизводительные системы будут иметь гибридную архитектуру »

Будет не далеко от истины, если сказать, что высокая производительность современных суперкомпьютеров во многом была достигнута за счет использования графических ускорителей (GPU). Об их роли в высокопроизводительных вычислениях и в решении реальных проблем бизнеса рассказал менеджер по работе с системными интеграторами Дмитрий Конягин из NVIDIA.

По его словам, сегодня уже никто не сомневается в том, будущие высокопроизводительные системы будут иметь гибридную архитектуру. Подтверждение этому тезису можно получить из списка Top 500 суперкомпьютеров – 19% всех FLOPS обеспечивается за счет CUDA (Compute Unified Device Architecture), а также экспоненциальным ростом вычислений на GPU, начиная с 2008 г. К примеру, за пять лет количество суперкомпьютеров с гибридной моделью вычислений выросло с 1 до 50. Многие основные приложения в области инженерного анализа, квантовой химии, молекулярной динамики и ряда других (в сумме – более 200) поддерживают вычисления на GPU. Ведущие мировые лаборатории по разработке нейронных сетей и алгоритмов искусственного интеллекта используют графические ускорители. Однако, кроме лабораторий, гибридные вычисления активно проникают и в коммерческий сегмент. Примерами могут служить поисковые системы многих интернет-компаний, использование GPU для улучшения качества распознавания речи компанией Nuance, ускорение аналитики при обработке массивов Big Data.

Докладчик отметил, что в последние годы архитектура х86 теряет пальму первенства как самой быстрорастущей – на смену ей приходит ARM. В соответствие с этой тенденцией, NVIDIA выпускает новое поколение набора для разработки CUDA для процессора ARM. Программирование на GPU поддерживается набором библиотек, директивы OpenACC для компилятора и расширениями языков C/C++/Fortran для CUDA.

В планах компании – выпуск архитектуры Maxwell в 2014 г., характеризующейся введением объединенной виртуальной памяти (Unified Virtual Memory) и далее – Вольта со стекированной DRAM.

Владимир Савяк: «Intel очень много делает для развития сегмента HPC. Кроме процессоров, компания поставляет средства межкомпонентной связи на базе технологий Ethernet и InfiniBand, сетевые карты 10 GbE, SSD, файловую систему Lustre, многие серверы хранения строятся на технологиях Intel»

Следствием массовости и доступности процессоров архитектуры х86 стал тот факт, что большая часть HPC-систем построена на технологиях Intel. Их представил менеджер по маркетингу СХД в СНГ Владимир Савяк из НР.

По его словам, Intel очень много делает для развития сегмента HPC. Кроме процессоров, компания поставляет средства межкомпонентной связи на базе технологий Ethernet и InfiniBand, сетевые карты 10 GbE, SSD, файловую систему Lustre, многие серверы хранения строятся на технологиях Intel.

Характеризуя новые возможности процессора Haswell, докладчик отметил, что появление AVX2 и FMA (Fused Multiply-Add) позволило выполнять 16 операций с плавающей точкой с двойной точностью за один такт, что вдвое превышает этот показатель у процессора предыдущего поколения Sandy Bridge. Для построения гибридных систем компания предлагает процессор Xeon Phi. Он создается по самому современному техпроцессу 14 нм. Сегодня анонсирован ряд моделей с разной стоимостью и производительностью, так что заказчик может выбрать процессор в соответствии со своими задачами.

Если говорить о технологиях межкомпонентной связи, то особенность InfiniBand от Intel заключается в том, что значительная часть операций по обработке стека выполняется процессором. Однако тесты HPC NOR and ROR, которые считаются наиболее репрезентативными, показали, что в зависимости от количества ядер в кластере задержка в таких системах от 48 до 83% ниже, чем в системах с off-load-машиной.

Для ускорения операций обмена данными применяется технология Dual Rail, заключающаяся в том, что каждый процессор передает данные по своей интерфейсной карте, что значительно сокращает задержки. При использовании в суперкомпьютерах оптической связи Intel предлагает переход на длину волны 1310 нм, при которой снижается дисперсия, и специально разработанный многомодовый оптоволоконный кабель ClearCurve LX, оптические свойства которого более устойчивы к изгибам. Кроме того, длина канала может быть увеличена до 300 м. Новый оптический коннектор MXC использует линзы, которые сводят входящие пучки света в параллельные. Коннектор рассчитан на 64 волокна, что дает суммарную пропускную способность 1,6 Тб/с.

По словам выступающего, в 2013 г. произошел некий перелом во взглядах корпоративных заказчиков на твердотельные диски. Очень многие компании приняли решение, что использование SSD в СХД является приоритетным. Для своих продуктов Intel гарантирует определенный высокий показатель производительности стабильный на протяжении достаточно длительного времени (к сожалению, цифры не были названы – прим. ред). По срокам эксплуатации компания гарантирует, что при десяти полных перезаписях в день время жизни диска составит более пяти лет.

На рынке не так много компаний, производящих управляющее ПО для НРС. Одна из них – Adaptive Computing, которая работает в этом сегменте уже более двенадцати лет. О деятельности компании рассказал инженер по продажам Юрий Рассохин.

В списке Top 500 суперкомпьютеров Adaptive управляет более чем 30% этих систем. Хотя суперкомпьютеры имеют огромное количество ядер и используются лишь для специфических задач, но успешная работа ПО на таких системах показывает его надежность и способность к масштабированию. Сегодня к управляющему ПО предъявляются требования не только управления ресурсами, но и контроля за физическими условиями, в которых работают системы.

В ходе выступления докладчик привел слова директора компании, что граница между НРС и облачными вычислениями начинает размываться. И в этой ситуации Adaptive занимает очень выгодную позицию, поскольку в равной степени создает как управляющее ПО для НРС, так и ПО для облачных вычислений. Это обусловлено тем, что продукты Adaptive основаны на одном и том же модуле для принятия решений.

Заключительный доклад на технологическом дне конференции сделал директор компании «Терминал-Сервис» Сергей Дудинов. Он был посвящен разработке сбалансированного кластера при ограниченном бюджете. В своем выступлении докладчик проанализировал вопросы, использовать ли при построении GPU, какую выбрать платформу, AMD или Intel, каково оптимальное количество процессоров на узел, использовать ли для внутренней связи Ethernet или InfiniBand, развернуть много слабых узлов или мало, но мощных, как сэкономить на СХД.

Каковы же результаты анализа? Будущие вычислительные архитектуры для задач с высоким уровнем распараллеливания станут гибридными, с графическими процессорами, работающими в связке с многоядерными ЦП. Что касается выбора GPU, то на текущий момент докладчик по ряду параметров, в том числе и по средствам программирования, рекомендовал последние версии Kepler. Если при выборе процессора руководствоваться показателем цена/производительность, то, по мнению выступающего, наилучшим выбором будет Xeon E5-2680V2 ($61 за 1 ГГц на ядро). При небольшом количестве узлов для внутренней связи InfiniBand будет и быстрее, и дешевле, чем Ethernet 10 GbE.

Для построения основной СХД рекомендуются комплексные аппаратно-программные решения «под ключ», к примеру, Terascala HPC Storage Solution (Dell), Quantum Dxi, HP 3PAR+ D2D StoreOnce и распределенные файловые системы, такие как Lustre, Google File System и т.п. Для бюджетного варианта можно собрать СХД по схеме RAID 6/60 на основе дисков класса enterprise с физическим подключением посредством InfiniBand.

Стратегія охолодження ЦОД для епохи AI

Чи використовує ваша компанія ChatGPT в роботі?

Колонка

BEST CIO

Человек года

Продукт года

Читайте также

Останні обговорення

ТОП-новини

ТОП-блоги

ТОП-статті