Anthropic випустила першу «гібридну» модель міркувань АІ

25 февраль, 2025 - 13:25
Anthropic презентувала нову модель під назвою Claude 3.7 Sonnet.
 
Компанія зазначає, що на відміну від своїх попередніх версій Claude 3.7 Sonnet може «думати» над питаннями до тих пір, поки користувачі задають їх йому. Тому в залежності від того, як довго він думає, його відповіді можуть бути дуже різними.
 
Заявлено, що це рішення першою «гібридною моделлю міркувань АІ», оскільки вона здатен відповідати в режимі реального часу, або ж може генерувати більш продумані відповіді за бажанням користувача. Користувачі можуть вибрати, коли активувати можливості міркування, а потім вказати, як довго система може розглядати питання.
 
Сьогодні Claude 3.7 Sonnet доступний для всіх, включаючи безкоштовних користувачів, але тільки ті, хто оплатить преміум-підписку, отримають доступ до розширених можливостей міркувань. Безкоштовні користувачі отримають лише версію в реальному часі, хоча компанія стверджує, що вона все одно є покращеною порівняно з попередньою версією, Claude 3.5 Sonnet.
 
Компанія заявила, що Claude 3.7 Sonnet коштуватиме $3 за 1 мільйон вхідних токенів. Компанія також стягує $15 за 1 мільйон вихідних токенів. 
 
Claude 3.7 Sonnet - це перша модель міркувань компанії, яка використовує більше обчислювальних потужностей і потребує більше часу для генерації відповідей, ніж традиційні моделі. Вони працюють, розбиваючи питання або проблему користувача на ряд невеликих кроків, розглядаючи кожен з них окремо, перш ніж скласти відповідь, і ця методика часто призводить до кращої відповіді.
 
Керівник відділу продуктів і досліджень Anthropic Діана Пенн ( Dianne Penn) розповіла в інтерв'ю VentureBeat, що мета полягає в тому, щоб модель знала, коли потрібна миттєва відповідь, а коли доречною буде більш обдумана відповідь. «Модель повинна сама розпізнавати, коли проблема вимагає більш інтенсивного мислення, і підлаштовуватися, а не вимагати від користувачів явно вибирати різні режими міркувань», - зазначила вона.
 
Ще однією цікавою особливістю Claude 3.7 Sonnet є те, що модель показуватиме свої внутрішні процеси мислення через «видимий блокнот». Користувачі зможуть бачити весь ланцюжок думок для більшості підказок.
 
Claude 3.7 Sonnet набрала 62,3% в реальному тесті кодування SWE-Bench, порівняно з 49,3% для OpenAI o3-mini та 49,2% для DeepSeek R1.