0 |
Уже є перший огляд OpenAI o3-pro – від користувача з раннім доступом. Це, до речі, той, хто першим досліджував o1-pro, якщо пам'ятаєте. Він ділиться цікавими спостереженнями. Головний висновок – ми входимо в епоху спеціалізованих моделей: є «звичайні» моделі для повсякденного спілкування на кшталт Claude 3.5 Sonnet, а є повільні й дорогі «reasoning» моделі для глибокого аналізу складних завдань.
Ключове відкриття автора повторює його висновок про o1-pro – з o3-pro не можна просто балакати, як із ChatGPT. Це скоріше генератор звітів: даєш контекст, ставиш завдання й отримуєш детальний аналіз. Коли вони зі співзасновником завантажили всю історію планерок свого стартапу і попросили скласти план розвитку, o3-pro видав настільки конкретні й обґрунтовані рекомендації, що це змінило їхнє бачення майбутнього компанії.
Модель помітно краще розуміє своє оточення, точніше визначає доступні інструменти й коли їх використовувати. Але без достатнього контексту схильна до «overthinking» – надмірного аналізу простих завдань.
За відчуттями автора, o3-pro кардинально відрізняється від Claude Opus і Gemini 2.5 Pro. Якщо Opus «відчувається великим», але ніколи не демонстрував явних ознак цієї «величності», то o3-pro дає якісно кращі результати. OpenAI явно робить ставку на вертикальний розвиток reasoning capabilities – навчаючи моделі не просто використовувати інструменти, а й розуміти, коли це робити.
Загалом, починаємо пробувати.
0 |