IBM випустила третє покоління своїх LLM для корпоративного AI

25 октябрь, 2024 - 16:25Sergey Petrenko

Перефразовуючи стару кіношну фразу, AI моделі запускають навіть найвідсталіші верстви населення. У сенсі, компанію IBM я частіше згадую, заглиблюючись в історію менеджменту і технологій. А даремно, напевно. Схоже там все цілком живо.

IBM запустила Granite 3.0, своє третє покоління великих мовних моделей (LLM) з відкритим вихідним кодом, спрямованих на підвищення можливостей корпоративного штучного інтелекту. Цей новий випуск містить універсальні моделі з 2 млрд і 8 млрд параметрів, а також спеціалізовані моделі Mixture-of-Experts і моделі Granite Guardian, орієнтовані на безпеку. Моделі призначені для різних корпоративних застосунків, як-от обслуговування клієнтів, автоматизація ІТ і кібербезпека, і їх було навчено з використанням 12 трлн токенів різноманітних даних, з акцентом на високоякісні вхідні дані та архітектурні інновації.

З огляду на вікову історію IBM саме на корпоративному ринку, перспективи у релізу непогані. Тим більше що, як повідомляє IBM, у тестах моделі перевершили конкурентів. При цьому моделі випущені під ліцензією Apache 2.0, що дає можливість широко використовувати їх у власних розробках як відкритих, так і комерційних.

IBM випустила третє покоління своїх LLM для корпоративного AI