0 |
Общедоступность цифровых камер, камерафонов и планшетов с возможностью фотосъемки необыкновенно упростила получение фотоснимков. Оборотной стороной такого прогресса стала многократно усложнившаяся задача сортировки массы накопившихся фотографий, нахождения среди них нужных и интересных, и компоновки из них логических сюжетов.
Решить ее призван метод, разработанный командой во главе с Леонидом Сигалом (Leonid Sigal) из Disney Research, который был представлен на Зимней конференции IEEE по приложениям компьютерного зрения (WACV 2015), прошедшей 6-9 января в Вайколоа Бич (Гавайи).
Система автоматической компоновки фотоальбомов не только сортирует фотоснимки по критериям качества и релевантности, но и пытается составлять из них логическую последовательность.
«Профессиональные фотографы, составляющие свадебные альбомы или слайд-шоу, знают, что точный хронологический порядок снимков зачастую менее важен, чем логика повествования», — говорит Сигал.
Так, в фоторассказах, составленных четырьмя участниками эксперимента из пяти фотографий, хронологическая последовательность не соблюдалась в 40% случаев. При этом, последующая проверка с использованием крауд-ресурса Mechanical Turk показала, что люди отдавали предпочтение именно таким подборкам, а не скомпонованным произвольно или согласно времени съемки.
Однако процесс создания альбомов вручную может быть очень трудоемким, особенно в случае больших фотоколлекций. Поэтому исследовательская группа, включающая, помимо сотрудников Disney Research, их коллег из Университета Центральной Флориды и Вашингтонского университета, попыталась найти способ его автоматизации.
Компьютерная модель, созданная ими, учитывает множество факторов, таких как наличие или отсутствие лиц на фотографии и их пространственное расположение, текстуры и цвета сцены, эстетическое качество каждого изображения. Обучающие алгоритмы позволили внедрить в программу «знания» практических правил компоновки, например, в отношении того, какие фото лучше ставить в начало, середину и конец альбома, или того, что следует избегать однотипных снимков.
Для тренировки программы использовались тысячи изображений Flickr, разделенные на 63 тематических фотосета. Каждая коллекция обрабатывалась четырьмя подопытными, которые составляли пятиснимочные альбомы и группировали одинаково выглядящие фотографии.
Обученная система успешно справляется с задачей компоновки альбомов из неупорядоченных и неаннотированных массивов фотоснимков. Сигал обращает внимание, что она также может адаптировать процесс формирования фотоподборок в соответствии с усвоенными при обучении предпочтениями индивидуальных пользователей.
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365
0 |