0 |
Компанія IBM розкрила технічні характеристики свого нового процесора Telum II, який стане основою для наступного покоління мейнфреймів і підвищить їхню значущість в індустрії обробки даних штучного інтелекту.
Подробиці про новий чіп були представлені на заході Hot Chips 2024. За словами компанії, розширені можливості процесора допоможуть прискорити як традиційні моделі штучного інтелекту, так і нові великі мовні моделі, що використовують нову техніку, відому як «ансамблевий AI».
Процесор IBM Telum II вирізняється новим блоком обробки даних, який використовується для розвантаження деяких обчислювальних завдань і підвищення загальної обчислювальної ефективності чипа. За словами представників компанії, новий DPU призначений для прискорення складних протоколів введення-виведення для мереж і систем зберігання даних у мейнфреймах компанії.
На додаток до нового чипа компанія представила подробиці про новий прискорювач IBM Spyre, який буде використовуватися в тандемі з Telum, забезпечуючи додатковий імпульс для робочих навантажень штучного інтелекту.
IBM обіцяє значне зростання загальної обчислювальної продуктивності, коли наприкінці року буде випущено мейнфрейм нового покоління. Новий чип Telum, створений за 5-нанометровим техпроцесом Samsung Foundry, стане серцем нового мейнфрейма IBM Z, забезпечуючи підвищену частоту та обсяг пам'яті, що дасть змогу на 40% підвищити продуктивність кешу та інтегрованих ядер AI-прискорювача.
Повідомляється, новий чип, наступник оригінального процесора Telum, що дебютував у 2021 році, має вісім високопродуктивних ядер на частоті 5,5 ГГц, з 36 МБ пам'яті на ядро. Це на 40% збільшує обсяг кеш-пам'яті на кристалі, що загалом становить 360 МБ.
Крім того, Telum II оснащений поліпшеним інтегрованим прискорювачем штучного інтелекту, що забезпечує низьку затримку і високу пропускну здатність операцій виведення AI в процесі транзакцій. Це робить його більш придатним для таких додатків, як виявлення шахрайства у фінансових операціях у режимі реального часу.
Водночас вбудований блок прискорення введення/виведення DPU має призвести до значного поліпшення можливостей чипа з обробки даних, причому IBM обіцяє 50-відсоткове збільшення загальної щільності введення/виведення.
Що стосується прискорювача Spyre, то це спеціально розроблений прискорювач корпоративного класу, призначений для клієнтів, які хочуть використовувати свої мейнфрейми для обробки даних штучного інтелекту. За словами представників IBM, він призначений для підвищення продуктивності найскладніших AI-моделей, включно з додатками генеративного AI.
Для цього він оснащений 1 ТБ пам'яті, розподіленої по восьми картах звичайної скриньки вводу-виводу. У ньому 32 обчислювальних ядра, що підтримують типи даних int4, int8, fp8 і fp16, що дає змогу знизити затримки та підвищити пропускну здатність для будь-яких AI-додатків.
IBM пояснила, що Telum II та Spyre були розроблені для роботи в тандемі, забезпечуючи масштабовану архітектуру для ансамблевих методів AI-моделювання. Ансамблеві методи мають на увазі об'єднання декількох моделей AI машинного навчання і глибокого навчання з кодувальними LLM. Використовуючи сильні сторони кожної архітектури моделі, ансамблеві моделі можуть давати точніші результати порівняно з використанням тільки одного типу моделі.
Тіна Таркініо (Tina Tarquinio), віцепрезидентка IBM з управління продуктами для IBM Z і LinuxONE, каже, що нові чипи дають змогу компанії залишатися «попереду всіх», оскільки вона прагне задовольнити висхідні потреби в штучному інтелекті. «Процесор Telum II та прискорювач Spyre створені для забезпечення високопродуктивних, захищених і більш енергоефективних корпоративних обчислювальних рішень», - пообіцяла вона.
За словами компанії, Telum II підходить для цілої низки спеціалізованих AI-додатків, які традиційно виконуються на базі її мейнфреймів Z. Зазначається, ансамблеві методи AI особливо добре підходять для підвищення ефективності виявлення страхового шахрайства. Чипи також можуть підтримувати системи виявлення відмивання грошей, забезпечуючи роботу передових алгоритмів, які можуть виявляти підозрілу фінансову діяльність у режимі реального часу, знижуючи ризик фінансових злочинів.
Крім того, Telum II є ідеальною основою для генеративних AI-помічників, підтримуючи передачу знань і пояснення коду, а також інші необхідні завдання.
Заявлено, чипи Telum II дебютують у наступних версіях мейнфреймів IBM Z і систем IBM LinuxONE, запуск яких намічено на кінець цього року.
Про DCIM у забезпеченні успішної роботи ІТ-директора
0 |