Anthropic запускає нові передові моделі: Claude Opus 4 та Sonnet 4

23 май, 2025 - 14:35

Розробник великих мовних моделей Anthropic представив новітні моделі Claude 4 frontier, починаючи з Opus 4 і Sonnet 4, які, за словами компанії, встановлюють нові стандарти для кодування, розвинених міркувань і агентів AI.

Opus - найпотужніша модель компанії на сьогодні, розроблена для підтримки продуктивності складних, тривалих завдань, які можуть містити тисячі кроків.

Anthropic заявила, що вона розроблена для підтримки агентів AI, які можуть працювати протягом кількох годин поспіль. Агенти AI – це тип програмного забезпечення AI, яке діє автономно, практично без участі людини. Вони можуть обробляти інформацію, приймати рішення та виконувати дії на основі власної внутрішньої логіки, розуміння довкілля та поставленої мети.

"Opus 4 пропонує дійсно просунуті міркування для кодування", - сказав Юсуке Кадзі (Yusuke Kaji), генеральний менеджер з AI в Rakuten Group. "Коли наша команда розгорнула Opus 4 у складному проєкті з відкритим вихідним кодом, він автономно кодував майже сім годин - величезний стрибок у можливостях AI, який вразив команду".

Алекс Альберт (Alex Albert), керівник відділу зв'язків із розробниками в Anthropic, повідомив, що нова версія Opus досягла значних показників у плані того, як довго вона може підтримувати виконання завдань: «Коли ви виконуєте завдання, які виконував Rakuten, ви можете змусити моделі працювати так довго, що зовсім неймовірно. Порівняно з попередніми моделями ви могли б вичавити від 30 хвилин до години узгодженої роботи».

З новим складанням AI, за словами Альберта, Anthropic побачила, що модель працює ще довше при внутрішньому тестуванні.

Багато в чому це пов'язано з тим, що обидві моделі отримали суттєві покращення у тренуванні пам'яті, так що їм не потрібно так покладатися на свої контекстні вікна. Це загальний обсяг токенів або даних, які велика мовна модель може враховувати під час підготовки відповіді.

"Вона може записувати у зовнішній блокнот, підсумовувати свої результати та стежити за тим, щоб не застрягати", - сказав Альберт. «Отже, коли його пам'ять треба знову стерти, у нього є деякі керівництва та стікери, по суті, до яких він може звернутися».

Sonnet 4 діє як пряме оновлення для Sonnet 3.7, надаючи модель, розроблену для суворого дотримання інструкцій, зберігаючи при цьому високу продуктивність з кодуванням та міркуваннями.

За визнанням Альберта, Anthropic витратила час на навчання Claude Sonnet 4, щоб він з меншою ймовірністю зійшов з второваного шляху, як його попередник. Він описав його як «трохи надто нетерплячий». Компанія зробила основний упор на Sonnet 4, щоб він був більш керованим і контрольованим, особливо в налаштуваннях кодування.

"Отже, ми скоротили цю поведінку, яку ми назвали хакерством винагороди, приблизно на 80%, а хакерство винагороди - це тенденція шукати короткі шляхи", - сказав Альберт. "Отже, можливо, це схоже на створення додаткового коду, щоб, наприклад, задовольнити всі тести, коли насправді цього не повинно бути".

Обидві моделі є «гібридними», що означає, що вони є «моделями, що мислять», здатними до покрокового міркування або миттєвої відповіді залежно від бажань користувача.

Крім нових передових моделей Anthropic також анонсувала нові інструменти для їх супроводу, включаючи загальнодоступну Claude Code, нову модель, спеціально орієнтовану на завдання агентного кодування. Раніше вона була доступна лише у бета-версії. Claude Code – це інструмент, який знаходиться в терміналі, редакторі коду або навіть доступний через комплект розробки програмного забезпечення. Він розуміє кодові бази розробників і може допомогти у прискоренні завдань кодування за допомогою підказок природною мовою.

Компанія запустила чотири нові можливості інтерфейсу прикладного програмування через Anthropic API, які дозволять розробникам створювати потужніші агенти AI. До них відносяться інструмент виконання коду, з'єднувач для протоколу контексту моделі, API файлів та можливість кешування підказок терміном до однієї години.

Обидві моделі покращили та розширили використання інструментів, таких як вебпошук, під час розширеного мислення, що дозволяє Claude перемикатися між міркуваннями та використанням інструментів.

Як повідомив Альберт, у попередніх моделях вони робили всі свої міркування заздалегідь, а потім викликали інструменти. З можливістю чергування вони можуть розмірковувати, викликати інструмент та повертатися до міркувань. Це відкриває нові горизонти для можливостей LLM.

Замість надання сирих розумових процесів Claude тепер ділитиметься зручними для користувача резюме. За словами Anthropic, це збереже видимість для користувачів, одночасно краще захищаючи моделі від потенційних змагальних атак.