Эмоциональная релаксация — будущая специальность смартфона?

5 декабрь, 2012 - 15:30

На проходящем сегодня семинаре IEEE по технологиям разговорного языка сотрудники университета Рочестера рассказали о компьютерном алгоритме, который, с высокой точностью определяет настроение человека, анализируя его речь.

Экспериментальная программа отслеживает 12 базовых характеристик (высота тона, громкость и т.п.) и идентифицирует шесть эмоциональных состояний, таких как печаль, удовольствие, страх, отвращение, невозмутимость. Указанный алгоритм применялся для анализа образцов звукозаписи, где в исполнении актеров произносились даты месяца. Интересно, что ученые в данной работе абстрагировались от смысла сказанного и считали, что эмоциональную окраску речи однозначно определяет уже само звучание.

При тестировании алгоритма зафиксирована высокая точность — 81% совпадений. Этот результат существенно лучше прежних работ, в которых достигалась, максимум, 55%-ная точность.

Несмотря на возросшую эффективность новый подход имеет общую с прежними слабую сторону: точность остается высокой только при оценке того голоса, на котором происходило обучение системы. Смена голоса приводит к ухудшению результата с 81% до 30%. Ученые ищут, как минимизировать негативный эффект. Для этого они, в частности, пробуют изначально тренировать программу на голосовом материале целой возрастной или гендерной группы.

Решение этой проблемы сделало бы возможным широкое применение детектора эмоций в реальной жизни. Однако, даже «завязанный» на один голос данный алгоритм окажется полезным, например, позволяя менять цветовое оформление экрана или рингтон, подстраивая их под настроение владельца смартфона.