Прискорювачі AMD Instinct MI300X забезпечують підтримку робочих навантажень служби Microsoft Azure OpenAI

23 май, 2024 - 11:35

У рамках участі у конференції Microsoft Build компанія AMD продемонструвала свої новітні комплексні обчислювальні та програмні можливості для клієнтів та розробників Microsoft. Використовуючи рішення AMD, такі як прискорювачі AMD Instinct MI300X, відкрите програмне забезпечення ROCm, процесори та програмне забезпечення Ryzen AI, а також медіаприскорювачі Alveo MA35D, Microsoft може надати потужний набір інструментів розгортання на основі штучного інтелекту на численних ринках. Нові віртуальні машини Microsoft Azure ND MI300X тепер загальнодоступні, надаючи таким клієнтам, як Hugging Face, доступ до дивовижної продуктивності та ефективності для найвибагливіших робочих навантажень штучного інтелекту.

"Програмний стек AMD Instinct MI300X і ROCm використовується в службах Azure OpenAI Chat GPT 3.5 і 4, які є одними з найвибагливіших робочих навантажень штучного інтелекту у світі", - сказав Віктор Пенг (Victor Peng), президент AMD. "Завдяки загальнодоступності нових віртуальних машин Azure клієнти AI отримують ширший доступ до MI300X для надання високопродуктивних та ефективних рішень для AI-додатків".

"У Microsoft і AMD багата історія партнерства на різних обчислювальних платформах: спочатку ПК, потім спеціальні мікросхеми для Xbox, HPC, а тепер і штучний інтелект", - сказав Кевін Скотт (Kevin Scott), головний технічний директор та виконавчий віцепрезидент підрозділу штучного інтелекту Microsoft. «У недавньому минулому ми усвідомили важливість поєднання потужного обчислювального обладнання з оптимізацією системи та програмного забезпечення, необхідної для забезпечення приголомшливої продуктивності та цінності штучного інтелекту. Разом з AMD ми досягли цього завдяки використанню ROCm та MI300X, надавши клієнтам та розробникам Microsoft AI можливість досягти відмінних результатів щодо співвідношення ціна-якість для найпередовіших моделей з інтенсивними обчисленнями. Ми віддані нашій співпраці з AMD, щоб продовжувати просувати прогрес у галузі штучного інтелекту».

Серія віртуальних машин Azure ND MI300x v5, про яку раніше було оголошено у попередній версії у листопаді 2023 року, тепер доступна в Центральному регіоні Канади, щоб клієнти могли виконувати свої робочі навантаження AI. Маючи кращу в галузі продуктивність, ці віртуальні машини забезпечують виняткову місткість HBM і пропускну здатність пам'яті, дозволяючи клієнтам розміщувати більші моделі в пам'яті графічного процесора та/або використовувати менше графічних процесорів, що в кінцевому підсумку допомагає заощадити електроенергію, витрати та час на рішення.

Ці віртуальні машини та програмне забезпечення ROCm, що їх підтримує, також використовуються для робочих навантажень Azure AI Production, включаючи службу Azure OpenAI, що надає клієнтам доступ до моделей GPT-3.5 та GPT-4. Завдяки AMD Instinct MI300X та перевіреному та готовому відкритому програмному стеку ROCm Microsoft може досягти найкращого співвідношення ціни та продуктивності при робочих навантаженнях виведення GPT.

Крім виробничих робочих навантажень штучного інтелекту Azure, одним із перших клієнтів, які використовують ці віртуальні машини, є Hugging Face. Перенісши свої моделі на віртуальні машини ND MI300X всього за один місяць, компанія Hugging Face змогла досягти дивовижної продуктивності за співвідношенням ціна/продуктивність для своїх моделей. В рамках цього клієнти віртуальних машин ND MI300X можуть переносити моделі Hugging Face на віртуальні машини для простого та ефективного створення та розгортання додатків NLP.

«Тісна співпраця між Microsoft, AMD та Hugging Face в екосистемі відкритого програмного забезпечення ROCm дозволить користувачам Hugging Face запускати сотні тисяч моделей штучного інтелекту, доступних у Hugging Face Hub в Azure, з графічними процесорами AMD Instinct без зміни коду, що спростить роботу. Клієнти Azure повинні створювати штучний інтелект з використанням відкритих моделей та відкритого вихідного коду», - сказав Жюльєн Саймон (Julien Simon), головний євангеліст Hugging Face.

Крім того, розробники можуть використовувати програмне забезпечення AMD Ryzen AI для оптимізації та розгортання результатів штучного інтелекту на ПК із процесорами AMD Ryzen AI. Програмне забезпечення Ryzen AI дозволяє запускати програми на нейронному процесорі (NPU), побудованому на архітектурі AMD XDNA, першому спеціалізованому процесорі штучного інтелекту на процесорі Windows x86. Хоча запуск моделей штучного інтелекту лише на центральному або графічному процесорі може швидко розряджати батарею, на ноутбуці з процесором Ryzen моделі штучного інтелекту працюють на вбудованому NPU, вивільняючи ресурси процесора та графічного процесора для інших обчислювальних завдань. Це допомагає значно збільшити термін служби батареї та дає можливість розробникам ефективно та локально запускати робочі навантаження LLM AI та паралельні програми на пристрої.

Microsoft вибрала медіаприскорювач AMD Alveo MA35D для підтримки своїх великих робочих навантажень потокового відео в реальному часі, включаючи Microsoft Teams, відео SharePoint та інші. Alveo MA35D, спеціально створений для підтримки інтерактивних потокових сервісів у реальному часі, допоможе Microsoft забезпечити високоякісне відео шляхом оптимізації робочих навантажень з обробки відео, включаючи транскодування, декодування, кодування та потокову передачу з адаптивним бітрейтом (ABR). Використовуючи прискорювач Alveo MA35D на серверах на базі процесорів AMD EPYC четвертого покоління, Microsoft отримує:

- Можливість консолідації серверів та хмарної інфраструктури. Використовуючи високу щільність каналів, енергоефективність та можливості обробки відео із наднизькою затримкою Alveo MA35D, Microsoft може значно скоротити кількість серверів, необхідних для підтримки великих обсягів інтерактивних потокових програм у реальному часі.

- Виняткова продуктивність - Alveo MA35D оснащений блоками обробки відео на базі ASIC, що підтримують стандарт стиснення AV1 та оптимізацію якості відео з підтримкою AI, які допомагають забезпечити плавне та плавне відтворення відео.

- Готова до майбутнього технологія AV1 - Alveo MA35D з можливістю оновлення для підтримки нових стандартів, таких як AV1, надає Microsoft рішення, яке може адаптуватися до змінних вимог до обробки відео.

Сьогодні процесори AMD EPYC четвертого покоління використовуються у численних віртуальних машинах загального призначення, що інтенсивно використовують пам'ять, оптимізованих для обчислень та прискорених обчислень в Azure. Ці віртуальні машини демонструють зростання та попит на процесори AMD EPYC у хмарі та можуть забезпечити підвищення продуктивності до 20% для віртуальних машин загального призначення та з інтенсивним використанням пам'яті при кращому співвідношенні ціни та продуктивності, а також до 2-кратного збільшення продуктивності CPU для віртуальних машин, оптимізованих для обчислень, в порівнянні з попереднім поколінням віртуальних машин на базі процесорів AMD EPYC в Azure. Серії віртуальних машин Dalsv6, Dasv6, Easv6, Falsv6 та Famsv6, які зараз перебувають у попередній версії, стануть загальнодоступними протягом найближчих місяців.