Компанія Google анонсувала випуск Gemini 2.5 Flash у попередньому доступі на своїх платформах для розробників.
Зазначається, що Gemini 2.5 Flash базується на 2.0 Flash, існуючої високопродуктивної моделі з низькою затримкою, призначеної для роботи агентів АІ.
У Google заявили, що нова модель має розширені можливості міркування і може розбивати складні завдання на покрокові плани, перш ніж відповідати.
«Gemini 2.5 Flash - це наша перша повністю гібридна модель міркувань, яка дає розробникам можливість вмикати та вимикати мислення», - йдеться в повідомленні Google.
Також наголошується, що модель також дозволяє розробникам встановлювати бюджет на мислення, щоб знайти правильний компроміс між якістю, вартістю і затримкою.
У Google підкреслили, що компанія усвідомлює, що функція мислення споживає токени, що може збільшити час і вартість. Щоб надати розробникам гнучкості в тому, як працює модель, компанія надає їм можливість обмежити максимальну кількість токенів, які модель витрачатиме на мислення. Більший бюджет покращить якість, але сповільнить роботу, а менший - пришвидшить її. Модель також навчена автоматично встановлювати бюджет залежно від складності запиту.
Вхідні токени для Gemini 2.5 Flash коштують 15 центів за мільйон і 60 центів за мільйон вихідних токенів без міркувань. З активним мисленням вартість зростає до $3,50 за мільйон токенів.
За даними Google, 2.5 Flash виявився значним поліпшенням порівняно з 2.0 Flash, особливо щодо здатності до міркувань.
Нова модель доступна з сьогоднішнього дня через інтерфейс прикладного програмування Gemini в Google AI Studio і на Vertex AI.
Kingston повертається у «вищу лігу» серверних NVMe SSD