Google випустила Gemini 2.5 Flash у попередній версії для розробників

18 апреля 2025 г., 17:31

Software

Компанія Google анонсувала випуск Gemini 2.5 Flash у попередньому доступі на своїх платформах для розробників.

Зазначається, що Gemini 2.5 Flash базується на 2.0 Flash, існуючої високопродуктивної моделі з низькою затримкою, призначеної для роботи агентів АІ.

У Google заявили, що нова модель має розширені можливості міркування і може розбивати складні завдання на покрокові плани, перш ніж відповідати.

«Gemini 2.5 Flash - це наша перша повністю гібридна модель міркувань, яка дає розробникам можливість вмикати та вимикати мислення», - йдеться в повідомленні Google.

Також наголошується, що модель також дозволяє розробникам встановлювати бюджет на мислення, щоб знайти правильний компроміс між якістю, вартістю і затримкою.

У Google підкреслили, що компанія усвідомлює, що функція мислення споживає токени, що може збільшити час і вартість. Щоб надати розробникам гнучкості в тому, як працює модель, компанія надає їм можливість обмежити максимальну кількість токенів, які модель витрачатиме на мислення. Більший бюджет покращить якість, але сповільнить роботу, а менший - пришвидшить її. Модель також навчена автоматично встановлювати бюджет залежно від складності запиту.

Вхідні токени для Gemini 2.5 Flash коштують 15 центів за мільйон і 60 центів за мільйон вихідних токенів без міркувань. З активним мисленням вартість зростає до $3,50 за мільйон токенів.

За даними Google, 2.5 Flash виявився значним поліпшенням порівняно з 2.0 Flash, особливо щодо здатності до міркувань.

Нова модель доступна з сьогоднішнього дня через інтерфейс прикладного програмування Gemini в Google AI Studio і на Vertex AI.

Стратегія охолодження ЦОД для епохи AI