Нейросеть Google распознает по фотографии место съемки

26 февраль, 2016 - 17:25
Нейросеть Google распознает по фотографии место съемки

Трое разработчиков из компании Google создали программу PlaNet, которая по фотографии определяет где она была снята, причём, справляется с этой задачей лучше, чем контрольная группа людей. Статья, где описан их эксперимент, доступна на допечатном сервере arXiv.

В своей программе команда во главе с Тобиасом Вэйандом (Tobias Weyand) использовала нейронную сеть глубокого обучения, которую они тренировали на фотобанке из 126 млн снимков с прилагающейся геопозиционной информацией.

В качестве экзамена авторы «скормили» PlaNet 2,3 млн фотографий из Flickr, блокировав доступ к соответствующим геометкам. Результаты прохождения теста показывают, что в 3,6% случаев приложение оказалось способно определять место съемки с точностью до улицы. На уровне города точность улучшалась до 10,1%, на уровне страны — 28,4% и континента — 48%.

Кроме того, PlaNet в 28 из 50 раундов победила соревновавшуюся с ней контрольную группу из десяти добровольцев, продемонстрировав вдвое меньшую среднюю ошибку позиционирования.

По достигнутым результатам PlaNet намного превосходит и известные экспериментальные программы, при том, что в несколько раз меньше их по объёму. «Наша модель использует всего 377 МБ, благодаря чему может уместиться даже в памяти смартфона», — завил Вейанд.