IBM презентувала нові мультимодальні та мислездатні AI-моделі «Granite», створені для підприємств

27 февраля 2025 г., 15:35

Компанія IBM представила наступне покоління сімейства великих мовних моделей (LLM) Granite - Granite 3.2 - у рамках продовження зусиль зі створення невеликого, ефективного і практичного корпоративного AI для реальних завдань. Усі моделі Granite 3.2 доступні під дозвільною ліцензією Apache 2.0 на сайті Hugging Face. Окремі моделі доступні на IBM watsonx.ai, Ollama, Replicate і LM Studio, а незабаром очікується поява RHEL AI 1.5, що дасть змогу розширити можливості підприємств і спільноти розробників із відкритим вихідним кодом.

Основні моменти включають:
Нова модель мови бачення (VLM) для задач розуміння документів, яка демонструє продуктивність, що відповідає або перевершує продуктивність значно більших моделей - Llama 3.2 11B і Pixtral 12B - у найважливіших корпоративних бенчмарках DocVQA, ChartQA, AI2D і OCRBench1. На додачу до надійних навчальних даних IBM використовувала власний інструментарій Docling з відкритим вихідним кодом для обробки 85 млн PDF-файлів і створення 26 млн синтетичних пар питань-відповідей, щоб підвищити здатність VLM обробляти складні документо-ємні робочі процеси.

Можливості ланцюжка думок для поліпшення міркувань у моделях 3.2 2B і 8B з можливістю ввімкнення або вимкнення міркувань для оптимізації ефективності. Завдяки цій можливості модель 8B досягла двозначного поліпшення порівняно зі своєю попередницею в еталонних завданнях із виконанням інструкцій, як-от ArenaHard і Alpaca Eval, без зниження безпеки або продуктивності в інших місцях. Ба більше, завдяки використанню нових методів масштабування виводів, модель Granite 3.2 8B можна відкалібрувати так, щоб змагатися за продуктивністю з набагато більшими моделями, як-от Claude 3.5 Sonnet або GPT-4o, у таких еталонах математичного мислення, як AIME2024 і MATH500.

Зменшені розміри моделей безпеки Granite Guardian, які зберігають продуктивність попередніх моделей Granite 3.1 Guardian при зменшенні розмірів на 30%. У моделях 3.2 також з'явилася нова функція під назвою «вербалізована впевненість», яка пропонує більш тонку оцінку ризиків, що визнає неоднозначність у моніторингу безпеки.

Стратегія IBM зі створення невеликих спеціалізованих моделей AI для підприємств продовжує демонструвати свою ефективність під час тестування: модель Granite 3.1 8B нещодавно отримала високі оцінки точності в бенчмарку Salesforce LLM Benchmark for CRM.

Сімейство моделей Granite підтримується екосистемою партнерів, включно з провідними компаніями-розробниками програмного забезпечення, що впроваджують LLM у свої технології.

«У CrushBank ми на власному досвіді переконалися, що відкриті та ефективні моделі AI від IBM забезпечують реальну цінність для корпоративного AI, пропонуючи правильний баланс продуктивності, економічності та масштабованості», - говорить Девід Тан (David Tan), технічний директор CrushBank. «У Granite 3.2 з'явилися нові можливості для міркувань, і ми з нетерпінням чекаємо можливості використовувати їх для створення нових агентних рішень».

Granite 3.2 - це важливий крок у розвитку портфеля IBM і стратегії, спрямованої на створення невеликих практичних AI для підприємств. Хоча підходи до міркувань на основі ланцюжка думок є потужними, вони потребують значних обчислювальних потужностей, які необхідні не для кожного завдання. Саме тому IBM представила можливість програмно вмикати або вимикати ланцюжок мислення. Для простіших завдань модель може працювати без міркувань, щоб знизити непотрібні обчислювальні витрати. Крім того, інші методи міркувань, такі як масштабування висновків, показали, що модель Granite 3.2 8B може відповідати або перевершувати за продуктивністю набагато більші моделі в стандартних математичних тестах міркувань. Розвиток таких методів, як масштабування висновків, залишається одним із ключових напрямків роботи дослідницьких груп IBM.

Поряд із моделями Granite 3.2 для навчання, бачення та охорони, IBM випускає наступне покоління своїх моделей TinyTimeMixers (TTM) (менш ніж 10 М параметрів) із можливостями довгострокового прогнозування на два роки вперед. Це потужні інструменти для аналізу довгострокових тенденцій, включно з тенденціями у фінансах та економіці, прогнозування попиту в ланцюжках постачання і планування сезонних запасів у роздрібній торгівлі.

«Наступна ера AI - це ефективність, інтеграція і реальна віддача, коли підприємства зможуть домагатися потужних результатів без надмірних витрат на обчислення», - говорить Шрірам Рагхаван (Sriram Raghavan), віцепрезидент IBM AI Research. «Останні розробки IBM у сфері Granite, орієнтовані на відкриті рішення, демонструють ще один крок уперед на шляху до того, щоб зробити AI більш доступним, економічно ефективним і цінним для сучасних підприємств».