`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Ученые MIT смоделировали механизм зрительного восприятия образов

+22
голоса

Исследователи Института МакГоверна исследования мозга (McGovern Institute for Brain Research) Массачусетского технологического института предложили математическую модель, описывающую механизм идентификации объектов человеческим мозгом. Модель точно прогнозирует зрительное восприятие, это дает основание полагать, что процессы, происходящие в мозге, описаны адекватно. По мнению ученых, новая модель позволит усовершенствовать компьютерные системы распознавания объектов.

В модели использованы данные неврологических исследований, которые позволяют заключить, что в мозгу приматов отдельные процессы идентификации объектов (расположение, решение о том, что собой представляет объект и где он находится) обрабатываются разными частями мозга. Предложенная модель описывает, как эта разрозненная информация интегрируется в единое представление об объекте.

Ученые MIT смоделировали механизм зрительного восприятия образов

Cогласно предположению ученых, когда человек видит несколько разных объектов, отследить их все он не в состоянии. Поэтому создается достаточно грубая карта изображения, на которой выделяются наиболее интересные области, которые затем исследуются в поисках объекта определенного типа.

Предложенная модель была реализована в ПО: в нем создаются список важных признаков на характеристической карте, на его основе – список всех объектов, имеющих данные признаки; и одновременно – пространственная карта изображения, которая показывает, где находятся важные признаки. Сопоставление списков и карты позволяют определять значимость той или иной характеристики.

Обычные системы распознавания образов при поиске объектов заданного типа производит сканирование всего изображения с целью выявить сначала основные характеристики 1-го объекта, затем 2-го объекта и т.д. Новая система ограничивает область поиска теми областями, где наличие нужных характеристик наиболее вероятно.

Новое ПО использовалось для прогнозирования поведения человека (вернее, движения его глаз), анализирующего тестовые изображения. Оказалось, что ПО позволяет с большой точностью описать области тестовых изображений, вызывающие наибольшее внимание испытуемых при выполнении разных заданий.


Вы можете подписаться на наш Telegram-канал для получения наиболее интересной информации

+22
голоса

Напечатать Отправить другу

Читайте также

 

Slack подает жалобу на Microsoft и требует антимонопольного расследования от ЕС

 
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT