Компанія OpenAI офіційно анонсувала вихід Operator, попередньої версії АІ-агента загального призначення, який може взяти під контроль веб-браузер і самостійно виконувати певні дії.
Operator буде доступний спочатку користувачам у США за планом підписки ChatGPT Pro у 200 дол. З часом OpenAI планує розгорнути цю функцію для більшої кількості користувачів тарифів Plus, Team та Enterprise.
Як повідомляється, новий АІ-агент зможе автоматизувати самі різні завдання, як, наприклад, бронювання столиків у ресторанах і здійснення покупок в Інтернеті. В інтерфейсі Operator вже є кілька категорій завдань, з яких користувачі можуть вибирати, включаючи покупки, доставку, ресторани і подорожі - кожна з яких забезпечує різні види автоматизації.
Коли користувачі ChatGPT активують Operator, з'являється невелике вікно, де демонструється, як агент виконує завдання, разом з поясненнями конкретних дій.
OpenAI стверджує, що Operator працює на основі моделі Computer-Using Agent, або CUA, яка поєднує можливості компʼютерного зору моделі GPT-4o з міркуванням більш просунутих моделей OpenAI.
CUA навчений взаємодіяти з інтерфейсом веб-сайтів, а це означає, що йому не потрібно використовувати API, орієнтовані на розробника, для доступу до різних сервісів. Іншими словами, агент зможе використовувати кнопки, переміщатися по меню і заповнювати форми на веб-сторінці так само, як це робить людина.
OpenAI заявляє, що співпрацює з такими сервісами, як eBay, Priceline та Uber, щоб гарантувати, що Operator дотримується умов угод про надання послуг цих компаній.
CUA також навчений запитувати підтвердження користувача перед завершенням завдань із зовнішніми побічними ефектами.
OpenAI визнає, що Operator поки що не зможе надійно впоратися з багатьма складними або спеціалізованими завданнями, але це ще дійсно поки що попередня версія.
З міркувань обережності OpenAI також вимагає нагляду за деякими завданнями, такими як банківські транзакції. Компанія стверджує, що агент не збирає даних і не робить відповідних скріншотів.
OpenAI стверджує, що Operator може виконувати кілька завдань одночасно, але все ж таки існують ліміти.
Наглядачі відзначають, що Operator демонструє можливості, які попереднє покоління віртуальних асистентів ніколи не могло зробити.
Стратегія охолодження ЦОД для епохи AI