Компанія OpenAI представила GPT-5.2, і заявила, що це найкраща пропозиція для повсякденного професійного використання.



Зазначається, що модель значно краще створює електронні таблиці, розробляє презентації, сприймає зображення, пише код, використовує інструменти та розуміє довгі контексти. Вона стала доступною користувачам ChatGPT та через API (інтерфейс прикладного програмування).



Поява нових моделей від конкурентів, таких як Anthropic та Google (які також випустили Gemini 3), змусила OpenAI оголосити внутрішній стан "код ред" (code red) для прискорення покращення ChatGPT та відкладення інших проєктів. Це частина висококонкурентної боротьби за створення найбільш використовуваної моделі, оскільки компанія прагне виправдати свою оцінку в 500 млрд дол. та понад 1.4 трон дол. запланованих витрат.



"Ми оголосили цей код ред, щоб дійсно дати сигнал компанії, що ми хочемо мобілізувати ресурси в одній конкретній області, і це спосіб визначити пріоритети та речі, які можна деприоритизувати", — пояснила Фіджі Сімо (Fidji Simo), CEO із застосунків в OpenAI. Також було зазначено, що хоча це допомогло випуску моделі, вона була у розробці багато місяців. Генеральний директор OpenAI Сем Альтман (Sam Altman) повідомив, що очікує, що компанія вийде з режиму "код ред" до січня, оскільки вплив Gemini 3 на їхні метрики був меншим, ніж побоювалися.



OpenAI повідомила, що модель GPT-5.2 буде доступна у версіях Instant, Thinking та Pro. Версія Instant є швидшою для написання та пошуку інформації, Thinking краще підходить для структурованої роботи, такої як кодування та планування, а Pro забезпечить найбільш точні відповіді на складні запитання. За даними компанії, модель GPT-5.2 Thinking виграла або зрівняла рахунок проти провідних галузевих професіоналів у 70.9% добре визначених завдань у бенчмарку GDPval.



Модель також встановила нові рекорди у галузевих тестах: вона очолила рейтинг SWE-Bench Pro, який оцінює агентне кодування, та GPQA Diamond, бенчмарк наукових міркувань рівня випускників. Щодо конкуренції, остання модель Anthropic, Opus 4.5, отримала вищий бал у тесті SWE-Bench Verified, проте OpenAI заперечує це, заявляючи, що їхній власний тест SWE-Bench Pro є менш "контамінаційно стійким, складним, різноманітним та промислово релевантним".



GPT-5.2 також значно просунувся у кодуванні, довгому контексті та візії. Вона досягає майже 100% точності на варіанті MRCRv2 (4-needle) до 256k токенів і скорочує кількість помилок при інтерпретації діаграм і скріншотів програмних інтерфейсів приблизно вдвічі.



OpenAI, яка була заснована 10 років тому як дослідницька лабораторія, після запуску ChatGPT у 2022 році (яким щотижня користуються понад 800 мільйонів людей) стала однією з найшвидкозростаючих комерційних структур у світі.

