`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Компьютер учится узнавать карикатуры

+22
голоса

Компьютер учится узнавать карикатуры

Компьютеры сегодня уже довольно неплохо справляются с задачей сопоставления рисунков и реальных объектов, при условии, что анализируемые рисунки достаточно точны и подробны. Известны приложения, подбирающие соответствия схематичным описаниям участников происшествий в полицейской фотобазе. Однако, обучение их узнаванию примитивных или карикатурных образов, таких как детский рисунок кролика, сталкивается с принципиально другими проблемами.

Тому, чтобы ассоциировать с кроликом бесформенное существо с длинными ушами, хвостом-шариком и большими передними зубами, человека готовят многие годы знакомства с мультфильмами и детскими книжками. Соответственно, научить компьютер, как рисуют кролика люди можно, только используя большой массив настоящих рисунков.

Одно из первых исследований в области «семантического распознавания» абстрактных рисунков было выполнено в Техническом университете Берлина (Германия) и представлено на состоявшейся в прошлом месяце очередной ежегодной конференции-выставке технологий компьютерной графики SIGGRAPH.

Ученые начали с того, что проанализировали метки в большой онлайновой базе изображений LabelMe и выделили 250 названий объектов, имеющих наибольшую частотность. Затем они использовали краудсорсинговый ресурс фирмы Amazon под названием Mechanical Turk, чтобы нанять людей для рисования набросков, относящихся к этим 250 категориям. К собранным данным (всего, 20 тыс. рисунков) применялись существующие алгоритмы распознавания и машинного обучения. В конечном итоге был разработан интерфейс, позволяющий вводить новые наброски, которые в реальном времени категоризируются компьютерной программой.

На данный момент экспериментальное ПО успешно идентифицирует рисунки, относящиеся к одной из 250 категорий, в 56% случаев. Это совсем не плохо даже если сравнивать с результатами подопытных людей (73% успеха) и намного превышает эффективность применения стандартных программ машинного зрения.

Ограниченный словарь пока не позволяет говорить о широком применении данной разработки, но ее авторы уже подготовили бесплатную программу для iPhone/iPad, которая в дальнейшем может быть преобразована в игровые приложения.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

+22
голоса

Напечатать Отправить другу

Читайте также

Тут и сам то с трудом распознаешь кролика в некоторых рисунках...

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT