Оприлюднена в листопаді 66-та редакція списку TOP500 зафіксувала остаточне настання ери пост-екзафлопсних обчислень, підтвердивши стабільність лідерів індустрії на тлі загального зростання продуктивності систем.
Вже втретє поспіль увесь п'єдестал займають суперкомп'ютери, спроектовані та побудовані компанією HPE. Вендор з платформою Cray EX утримує шість позицій у першій десятці найшвидших систем світу та половину місць у топ-20 рейтингу енергоефективності Green500.

Безумовним лідером рейтингу залишається система El Capitan, розгорнута в Ліверморській національній лабораторії ім. Лоуренса (LLNL). Цей суперкомп'ютер не лише втримав першість, а й продемонстрував приріст продуктивності на 4% порівняно з попередніми бенчмарками, досягнувши вражаючого показника у 1,809 екзафлопс. Другу та третю сходинки посідають ветеран екзафлопсу Frontier з Ок-Ріджа (1,353 EFlops) та система Aurora з Аргонської лабораторії (1,021 EFlops).

Хоча всі три системи-лідери використовують ідентичну інфраструктурну базу у вигляді шасі Cray EX та інтерконекту HPE Slingshot, вони репрезентують фундаментально різні підходи до архітектури обчислювальних вузлів, що відображає конкуренцію між AMD та Intel. Система El Capitan, що побудована на базі прискорювачів AMD Instinct MI300A, демонструє переваги гібридної архітектури APU, де центральний та графічний процесори розміщені на одній підкладці й використовують спільну уніфіковану пам'ять HBM3. Такий підхід мінімізує затримки при переміщенні даних, що є критичним для класичного моделювання.

Натомість Aurora, яка посідає третє місце, використовує дискретну архітектуру від Intel, поєднуючи процесори Xeon Max та графічні прискорювачі Data Center GPU Max. Унікальність цієї конфігурації полягає в тому, що власну пам'ять HBM мають не лише відеокарти, а й центральні процесори. Це дозволяє системі демонструвати феноменальні результати у завданнях зі змішаною точністю, які є індикатором продуктивності для штучного інтелекту. Зокрема, у бенчмарку HPL-MxP Aurora видає рекордні 11,6 екзафлопс, випереджаючи навіть лідера загального заліку, що робить її надпотужним інструментом саме для генеративного АІ.

Успіх цих систем базується на комплексному оновленні портфоліо HPE, яке компанія називає другим поколінням екзафлопсних рішень. Інженери продовжують вдосконалювати спадщину Cray, зокрема технологію прямого рідинного охолодження. Сучасні блейд-сервери HPE мають 100% безвентиляторну конструкцію, що дозволяє ефективно відводити тепло від надщільних стійок. Саме ця технологія забезпечила високі показники енергоефективності, дозволивши системам на кшталт Isambard-AI та корпоративного кластера Samsung SSC-24 зайняти провідні позиції у рейтингу Green500.
HPE не обмежується лише американськими національними лабораторіями. HPC6 (Eni, Італія) з продуктивністю 477,9 петафлопс стала найпотужнішим у світі суперкомп'ютером промислового призначення (on-premises). Енергетичний гігант Eni використовує її для моделювання родовищ та геофізичних досліджень. Системи Alps (Швейцарія) та LUMI (Фінляндія) продовжують утримувати позиції головних наукових інструментів Європи (8-ме та 9-те місця відповідно).

Зростання потужностей неминуче ставить питання енергоспоживання. У рейтингу Green500, який оцінює енергоефективність (продуктивність на ват), 10 із 20 найкращих систем також належать авторству HPE.
Вендор активно просуває технологію прямого рідинного охолодження (Direct Liquid Cooling), яка дозволяє відмовитися від вентиляторів у обчислювальних вузлах. Серед лідерів ефективності: Isambard-AI (Бристольський університет): No. 4 у Green500 та SSC-24 (Samsung) - найенергоефективніший корпоративний суперкомп'ютер.

Окрім апаратних інновацій, важливим вектором розвитку залишається програмне забезпечення. Компанія оголосила про передачу проекту мови програмування Chapel до новоствореної High Performance Software Foundation (HPSF). Цей крок спрямований на стандартизацію засобів розробки для паралельних обчислень та залучення ширшої open-source спільноти до розвитку екосистеми HPC. Паралельно з цим HPE використовує власні внутрішні суперкомп'ютери, такі як система Portage, як полігони для відпрацювання реальних сценаріїв використання перед їх впровадженням у клієнтів.
Географія рейтингу також демонструє цікаві тренди, зокрема зростання попиту на «суверенний АІ» - національні обчислювальні центри, що гарантують цифрову незалежність країн. У поточному списку дебютували дві знакові системи такого класу. Канадська TELUS з продуктивністю 22,74 петафлопс стала найпотужнішою в країні, забезпечуючи локальну обробку даних. Ще однією помітною новинкою став запуск системи Alem.Cloud у Казахстані. З результатом 20,48 петафлопс цей суперкомп'ютер, розташований в Астані, посів 86-те місце у світі та став найшвидшим у Центральній Азії, відкриваючи можливості для розробки національних великих мовних моделей.

Зрештою, усі ці інженерні досягнення мають прикладне наукове значення. Цього року кілька наукових груп, що використовують суперкомп'ютери HPE, стали фіналістами престижної премії ACM Gordon Bell Prize. Дослідники використовували потужності El Capitan для створення високоточних цифрових двійників морського дна з метою прогнозування цунамі, а європейські системи LUMI та Alps забезпечили проведення надточних кліматичних симуляцій та перших повних квантово-механічних розрахунків нанотранзисторів. Спектр досліджень постійно розширюється, демонструючи унікальні можливості кожної системи. Зокрема, El Capitan виконує перші у своєму роді високоточні симуляції та використовує інноваційні методи глибокого навчання для наукового розуміння процесів згортання білків. На базі Frontier реалізується спільний проект інженерів та дослідників зі створення деталізованих моделей землетрусів для оцінки їх впливу на будівлі та мости з метою оновлення будівельних норм безпеки, а також досягнуто рекордних показників у моделюванні турбулентної гідродинаміки. У свою чергу, Aurora у співпраці з рентгенівським центром Advanced Photon Source створює бібліотеки даних для вивчення акумуляторних технологій на атомному рівні, що має на меті вдосконалення методів зберігання енергії та подовження терміну служби батарей.

Архітектурна еволюція платформи Cray EX: Масштаб та ефективність
Успіх систем HPE у TOP500 базується на комплексному оновленні портфоліо, яке компанія називає другим поколінням екзафлопсних рішень. В основі лежить архітектура HPE Cray Supercomputing EX, яка є кульмінацією десятиліть інновацій у високопродуктивних обчисленнях. Ця платформа розроблена для забезпечення безпрецедентної масштабованості та ефективності, дозволяючи інтегрувати тисячі обчислювальних вузлів та прискорювачів у єдину, високоінтегровану систему.
Ключовими компонентами цієї еволюції є переосмислені блейд-сервери (compute blades) та блейди прискорювачів (accelerator blades). Вони спроектовані для максимальної щільності обчислень, ефективно використовуючи простір стійки. Життєво важливим елементом є також власна мережева технологія HPE Slingshot. Це високошвидкісний, адаптивний інтерконект Ethernet, оптимізований для HPC-навантажень, який забезпечує низьку затримку та високу пропускну здатність, що критично для обміну даними між сотнями тисяч ядер у великих системах.
Не менш важливою є система охолодження. Інженери HPE продовжують вдосконалювати спадщину Cray, зокрема технологію прямого рідинного охолодження (Direct Liquid Cooling). Сучасні блейд-сервери HPE мають 100% безвентиляторну конструкцію, що дозволяє рідині безпосередньо відводити тепло від гарячих компонентів, таких як CPU та GPU. Це не тільки підвищує енергоефективність системи, але й значно знижує її акустичний шум та вимоги до кондиціонування приміщень.
Стратегія охолодження ЦОД для епохи AI