Facebook открыла код трех инструментов машинного зрения

26 август, 2016 - 16:15
Facebook открыла код трех инструментов машинного зрения

Группа исследований искусственного интеллекта компании Facebook (Facebook AI Research, FAIR) открыла для общего доступа исходные коды трёх инструментов машинного зрения: DeepMask, SharpMask и MultiPathNet.

В настоящее время это больше экспериментальные проекты, которые не применяются в потребительских решениях Facebook, однако похожие технологии компания использует в запущенной в апреле функции автоматического альтернативного текста, описывающей фотографии слепым. Помимо собственно кода, компания выложила также релевантные исследовательские статьи и демонстрации использования этих технологий.

DeepMask разделяет фотографии на сегменты вплоть до одного пикселя, изучает объекты на основе их характеристик и на миллионах примеров тренирует нейросеть глубокого обучения. SharpMask уточняет прогнозы DeepMask и позволяет системе машинного зрения Facebook узнавать любой объект на фотоснимке, а MultiPathNet маркирует каждый из них и распределяет по категориям.

Машинное зрение все еще не может конкурировать по эффективности с человеческим, но постепенно сокращает отставание. Facebook надеется, что оно в конечном счёте сделает возможным поиск среди изображений без меток и подписей. Компания также рассчитывает применить искусственный интеллект для распознавания видео в реальном времени.