`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

OpenAI розробляє АІ-систему, здатну генерувати 3D-моделі

0 
 
Компанія OpenAI детально описала POINT-E - нову систему штучного інтелекту, яка може генерувати 3D-моделі на основі текстових підказок.

Дослідницька група розмістила код POINT-E на GitHub.

Існує безліч додатків зі штучним інтелектом, які можуть генерувати двовимірні зображення на основі текстового опису, наданого користувачем. За даними OpenAI, такі програми рендерингують зображення за кілька секунд або хвилин при роботі на одній відеокарті дата-центру. На відміну від цього, генерація 3D-моделі зазвичай займає кілька годин при використанні порівнянного обладнання.

OpenAI створила POINT-E, щоб прискорити цей процес. За даними дослідницької групи, POINT-E може генерувати 3D-модель всього за одну хвилину при роботі на відеокарті Nvidia V100.

Коли система штучного інтелекту отримує запит від користувача з описом об'єкта, вона не генерує 3D-модель об'єкта безпосередньо. Замість цього система спочатку створює двовимірне креслення вказаного об'єкта. Далі POINT-E перетворює двовимірне креслення на тривимірну хмару точок, яка є базовою версією 3D-моделі, що виконує функцію контуру.

Кожен крок процесу виконується різною нейронною мережею. Перший крок, який передбачає перетворення користувальницького опису об'єкта в двовимірний малюнок, виконується нейронною мережею під назвою GLIDE, яку OpenAI спочатку випустила в минулому році. Версія GLIDE, що використовується в POINT-E, має три мільярди параметрів..

Після того, як POINT-E генерує двовимірний малюнок об'єкта, малюнок перетворюється на хмару точок двома окремими нейронними мережами. Перша генерує початкову хмару точок з низькою роздільною здатністю з 1000 пікселів. Другий алгоритм, який описується як простіша версія першого, додає ще 3000 пікселів для збільшення роздільної здатності хмари точок.

"Для моделей дифузії зображень найкраща якість зазвичай досягається за допомогою певної форми ієрархії, коли базова модель з низькою роздільною здатністю виробляє вихідні дані, які потім аналізуються іншою моделлю, - пояснюють вчені OpenAI в дослідницькій роботі, присвяченій POINT-E. - Наш апсемплер використовує ту ж архітектуру, що і наша базова модель".

Нейронні мережі, які Point-E використовує для генерації 3D-моделей, засновані на методі машинного навчання, відомому як дифузія. Цей метод, який був вперше представлений в 2015 році, також забезпечує АІф для генерації зображень, який Google дебютував на початку цього року.

Для побудови дифузійної моделі інженери створюють зображення, які містять тип помилки, відомий як гауссів шум. Потім вони доручають моделі дифузії видалити цей шум. Повторюючи цей процес багато разів, нейронна мережа може навчитися методам, які дозволяють їй генерувати нові зображення з нуля.

Після того, як POINT-E створює хмару точок об'єкта, вона перетворює хмару точок в 3D-модель за допомогою Blender, програми графічного дизайну з відкритим вихідним кодом. Процесом створення 3D-моделі в Blender керує автоматизований скрипт.

"Хоча наш метод можливо гірше справляється з цією оцінкою, ніж найсучасніші методи, він створює зразки за невелику частку часу, - деталізують дослідники OpenAI. - Це може зробити його більш практичним для певних застосувань або дозволити виявити більш якісні 3D-об'єкти шляхом вибірки багатьох об'єктів і визначенням найкращого з них".

Стратегія охолодження ЦОД для епохи AI

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT