Компанія Google випустила першу модель у новому сімействі штучного інтелекту Gemini 2.0.
Експериментальна версія Gemini 2.0 Flash стане основою для генеративних агентів і асистентів штучного інтелекту.
У компанії відзначили, що Flash 2.0 перевершує Gemini 1.5 Pro, найбільшу і найскладнішу модель штучного інтелекту компанії, в деяких ключових тестах, працюючи при цьому вдвічі швидше.
Модель підтримує вхідні дані, такі як зображення, відео та аудіо, але була оновлена для підтримки мультимодальності. Google також дозволив їй використовувати зовнішні інструменти, такі як пошук, виконання коду і сторонні функції.
Gemini 2.0 Flash тепер доступна для партнерів з раннім доступом через Google AI Studio і Vertex AI, хмарну платформу Google, яка дозволяє користувачам навчати і розгортати моделі. Загальнодоступність запланована на січень.
Запускаючи Gemini 2.0 Flash в роботу, команда Google заявила, що досліджує кілька нових продуктів, які будуть побудовані на його основі для використання нових функцій, які будуть зосереджені на генеративних агентах штучного інтелекту та можливостях асистентів.
«Власні можливості користувацького інтерфейсу Gemini 2.0 Flash, а також інші вдосконалення, такі як мультимодальні міркування, розуміння довгого контексту, комплексне виконання інструкцій і планування, композиційний виклик функцій, використання власних інструментів і поліпшена затримка, - все це працює разом, щоб забезпечити новий клас агентських можливостей», - йдеться в повідомленні Google про оновлення.
Google представила Project Astra як ініціативу з розробки універсального асистента зі штучним інтелектом на конференції Google I/O 2024 у травні. Astra здатний вести природні мовні розмови з користувачами та відповідати на запитання про світ.
Повідомляється, що з додаванням Gemini 2.0 Astra може взаємодіяти з Google Search для пошуку інформації, Об'єктивом для ідентифікації об'єктів та Картами для розуміння місцевості. Команда також покращила її здатність запам'ятовувати речі, що дозволяє їй пригадувати деталі з розмов, такі як нагадування, куди користувач хоче піти, номери телефонів і коди замків. Це також дозволяє користувачам персоналізувати асистента.
Також завдяки Gemini 2.0 Astra може перемикатися між кількома мовами посеред розмови. Ця ж можливість дозволяє йому краще розуміти акценти і незвичні слова, які можуть викликати проблеми навіть у багатьох сучасних моделей FS з розпізнаванням мови.
У Google заявили, що компанія працює над тим, щоб надати тестувальникам ці можливості АІ-асистента на більшій кількості пристроїв, таких як окуляри з функцією «вільні руки». Компанія також розширює кількість довірених тестувальників, які мають доступ до Astra.
Ще один прототип АІ-агента, який Google створює за допомогою Gemini 2.0 Flash, - Project Mariner, який дозволить моделі здійснювати веб-серфінг для користувачів. Вона здатна взяти під контроль браузер і розуміти інформацію на екрані, включаючи такі елементи, як посилання, текст, код, кнопки і форми для навігації по веб-сторінках.
Наразі Mariner тестується як розширення для Chrome, яке може виконувати деякі завдання за користувачів, залишаючи при цьому людину в курсі подій. Під час демонстрації систему попросили переглянути Google Sheet з назвами компаній та іменами людей і запропонував АІ-моделі знайти їхні контактні електронні адреси. Потім модель взяла на себе управління браузером, щоб перейти на веб-сайти, знайти адреси електронної пошти і, нарешті, відобразити знайдену інформацію.
Стратегія охолодження ЦОД для епохи AI