Компанія Amazon.com
офіційно представила Nova Act, нового агента штучного інтелекту, який може брати під контроль веб-браузер і самостійно виконувати деякі дії.
Новий агент АІ створено лабораторією Amazon AGI, що базується в Сан-Франциско і яку очолюють колишні дослідники OpenAI Девід Луан (David Luan) та Пітер Аббіль (Pieter Abbeel).
Amazon Act здатний виконувати елементарні завдання у веб-браузері від імені користувача, такі як натискання кнопок і введення тексту в поля.
Разом з випуском АІ-агента компанія також розширила доступ до SDK Nova Act. Комплект дозволить розробникам створювати агентів, здатних розбивати складні команди на серію дій, які можна виконати для досягнення мети.
Amazon заявила, що прагне навчити своїх АІ-агентів «мати таку ж інтуїцію щодо елементів користувацького інтерфейсу», як і у людей. Це означає, що вони будуть взаємодіяти з веб-сторінками так само, як це роблять люди, і зможуть розуміти іконки, форми, веб-елементи і все інше. Таким чином зможуть брати участь у спілкуванні нарівні з іншими людьми, ставлячи запитання або пропонуючи завдання, як, наприклад, у наведеному вище прикладі.
Анонс Amazon відбувся в той час, коли інші великі компанії - Google, OpenAI та Anthropic - працюють над створенням власних агентних рішень, які стають дедалі потужнішими. Але, як зазначають аналітики, Nova Act має великі шанси для успішного старту завдяки інтеграції з Alexa+, що вже має велику аудиторію.
Amazon стверджує, що Nova Act перевершує агентів OpenAI і Anthropic у кількох внутрішніх тестах компанії. Наприклад, у ScreenSpot Web Text, який вимірює, як агент AI взаємодіє з текстом на екрані, рішення отримало 94%, перевершивши OpenAI CUA (88%) то Anthropic Claude 3.7 Sonnet (90%).
Kingston повертається у «вищу лігу» серверних NVMe SSD