Google DeepMind випускає нове покоління відкритих моделей Gemma 4

3 апреля 2026 г., 9:35

Software

Компанія Google DeepMind офіційно представила нове покоління відкритих моделей штучного інтелекту - Gemma 4. Як повідомляється на офіційному ресурсі розробника, ця родина моделей побудована на тій самій архітектурній основі, що й флагманська серія Gemini 3.

Головною особливістю релізу стало поєднання високої продуктивності з можливістю локального запуску на споживчому обладнанні, включаючи робочі станції та мобільні пристрої. Gemma 4 розроблена для підтримки складних логічних міркувань та автономних агентних робочих процесів.

Лінійка включає чотири варіанти моделей, адаптованих під різні апаратні вимоги: компактні Effective 2B та Effective 4B (на 2 та 4 мільярди параметрів відповідно) для мобільних пристроїв, модель 26B з архітектурою Mixture of Experts (MoE) та найбільш потужну щільну модель 31B Dense на 31 мільярд параметрів. Усі версії є нативно мультимодальними, що дозволяє їм обробляти текст, зображення та відео.Усі версії є нативно мультимодальними, що дозволяє їм обробляти текст, зображення та відео. Молодші моделі (E2B та E4B) додатково отримали підтримку розпізнавання аудіо в реальному часі безпосередньо на пристрої. За заявою генерального директора Google DeepMind Деміса Хассабіса (Demis Hassabis), це найбільш здатні відкриті моделі компанії на сьогодні.

Технічні вдосконалення включають значне розширення вікна контексту: до 128 тис. токенів для молодших моделей та до 256 тис. для старших версій. Gemma 4 отримала вбудований режим «мислення» (thinking mode), який дозволяє моделі крок за кроком аналізувати задачу перед наданням відповіді. Крім того, реалізована нативна підтримка виклику функцій (function calling) та структурованого виводу у форматі JSON, що критично важливо для створення AI-агентів, інтегрованих із зовнішніми програмними інструментами та базами даних.

Показники продуктивності Gemma 4 демонструють значний відрив від попередніх ітерацій. У тестах на логічне мислення MMLU Pro та математичних змаганнях AIME 2026 старші моделі сімейства наблизилися до показників комерційних закритих систем. Завдяки оптимізації для графічних процесорів NVIDIA та AMD, розробники можуть розгортати ці моделі з високою швидкістю генерації навіть на стандартних відеокартах серії RTX. Моделі доступні для вільного використання як у дослідницьких, так і в комерційних цілях через популярні платформи, такі як Hugging Face.

Аналітики зазначають, що випуск Gemma 4 є стратегічним кроком Google для домінування в екосистемі відкритого софту. Надаючи доступ до архітектури Gemini 3 широкому загалу, компанія стимулює розробників створювати додатки саме в межах своєї технологічної рамки. Це створює серйозний тиск на конкурентів, особливо на Meta, оскільки Gemma 4 пропонує нативну мультимодальність та підтримку аудіо в компактних форматах, які раніше були доступні лише через складні інтеграції декількох систем.

Орієнтація на автономних агентів та локальне виконання є відповіддю на запит бізнесу щодо цифрового суверенітету та конфіденційності даних. Можливість запускати модель рівня 31B Dense на одній відеокарті дозволяє компаніям впроваджувати AI-асистентів у внутрішні контури без ризику витоку даних у хмару. У довгостроковій перспективі успіх Gemma 4 може призвести до появи нового покоління персоналізованих AI-пристроїв, де інтелект інтегрований у залізо на фундаментальному рівні, що зробить використання штучного інтелекту таким же звичним і швидким, як робота локальної файлової системи.

Стратегія охолодження ЦОД для епохи AI