+24 голоса |
Google набрав хід і дивує своїми запусками в галузі AI – компанія показала наступні версії своїх моделей для генерації відео та зображень – Veo 2 та Imagen 3, а також представила новий експериментальний інструмент Whisk.
Veo 2 демонструє дивовижні результати у створенні відео, краще розуміє фізику реального світу і нюанси людських рухів. Модель також розуміється на кінематографії – може працювати з різними жанрами, об'єктивами та спецефектами, створюючи відео з роздільною здатністю до 4K і тривалістю в кілька хвилин. При цьому вона рідше «галюцинує» зайві деталі на кшталт додаткових пальців.
Щоправда, поки що він доступний тільки в застосунку VideoFX, який доступний лише за інвайтами. Утім Google обіцяє, що протягом тижня кількість користувачів додатка збільшиться.
Imagen 3 тепер створює яскравіші та композиційно вивіреніші зображення, краще слідує промптам і може працювати в різних художніх стилях – від фотореалізму до аніме. Модель уже доступна в ImageFX більш ніж у 100 країнах.
Новий інструмент Whisk дає змогу використовувати зображення як промпти для візуалізації ідей. Він комбінує Imagen 3 з візуальними можливостями Gemini – останній автоматично створює детальний опис завантажених зображень, який потім використовується Imagen 3 для створення нових варіацій.
Утім, Whisk нам не доступний, тож почекаємо все відразу пробувати.
Комп’ютерний розум: генеративний штучний інтелект у рішеннях AWS
+24 голоса |
35 днів тому автор запитував: "Потенціал AI-чатботів вичерпано?", а сьогодні дає відповідь на своє ж питання: "Google дивує AI-новинками" ;-)