Компанія OpenAI офіційно представила GPT-5.4 - свою найбільш досконалу та ефективну модель.
Новинка вже доступна в ChatGPT під назвою GPT-5.4 Thinking, а також через API та в Codex.
Крім базової версії, компанія випустила GPT-5.4 Pro для користувачів, які потребують максимальної продуктивності на складних завданнях.
Зазначається, що GPT-5.4 об'єднує найкращі досягнення у сфері логічного мислення, програмування та агентних робочих процесів, замінюючи собою GPT-5.3-Codex і суттєво перевершуючи попередні версії за швидкістю та точністю.
Підкреслюється, що однією з головних інновацій став нативний режим використання комп'ютера (Computer Use). Тепер модель може самостійно керувати клавіатурою та мишею, переміщатися між програмами, працювати з браузером та виконувати складні ланцюжки дій у робочому середовищі.
У тесті OSWorld-Verified модель досягла результату 75,0%, що вперше перевищило середній показник людської продуктивності у 72,4%.
Модель підтримує контекстне вікно обсягом до 1 млн токенів, що дозволяє агентам планувати та перевіряти завдання на довгих часових горизонтах.
GPT-5.4 також стала на 33% менш схильною до фактичних помилок порівняно з GPT-5.2.
Ніко Групен (Niko Grupen), керівник прикладних досліджень у Harvey, зазначив: «GPT-5.4 встановлює нову планку для роботи з документами. На нашому тесті BigLaw Bench вона набрала 91%. Порівняно з іншими моделями, GPT-5.4 зараз краще структурує складний транзакційний аналіз, підтримує точність у довгих контрактах і забезпечує високий рівень деталізації, якого вимагають юристи».
За результатами тесту GDPval, модель зрівнялася або перевершила галузевих фахівців з результатом 83% порівнянь у 44 різних професіях.
Для розробників впроваджено функцію Tool Search, яка знижує витрати токенів на 47% у робочих процесах з великою кількістю інструментів.
Лі Робінсон (Lee Robinson), віцепрезидент з навчання розробників у Cursor, додав: «GPT-5.4 наразі є лідером у наших внутрішніх тестах. Наші інженери вважають її більш природною та впевненою, ніж попередні моделі. Вона працює над неоднозначними проблемами без вагань і активно розпаралелює роботу».
Модель доступна для користувачів планів Plus, Team та Pro, а корпоративні клієнти можуть активувати доступ через адмін-налаштування. Ціна за 1 млн токенів становить 2,50 дол. за вхідні та 15 дол. за вихідні дані, що відображає покращені можливості при вищій ефективності.
Випуск GPT-5.4 знаменує перехід від текстових асистентів до повноцінних АІ-агентів, здатних до автономної дії в операційних системах. OpenAI зміщує акцент з генерації контенту на виконання реальних операційних завдань, що підтверджується впровадженням нативного Computer Use. Це прямий виклик традиційним методам RPA (Robotic Process Automation), оскільки тепер АІ може взаємодіяти з будь-яким софтом через візуальне сприйняття скриншотів та координатні кліки. Показник успіху у 83% у тесті GDPval свідчить про те, що АІ починає реально конкурувати з кваліфікованими фахівцями в таких галузях, як фінанси, юриспруденція та медицина.