BlogSum извлекает знания из блогов

7 сентябрь, 2012 - 12:25

Несколько компьютерных специалистов университета Конкордиа в Монреале (Канада) разработали средство BlogSum, которое, по их заявлению, успешно справляется с весьма неординарной задачей: находит смысл в сообщениях социальных сетей.

Эта система имеет множество потенциальных приложений, в частности, она способна измерять такие факторы, как предпочтения потребителей и намерения избирателей. Сортируя веб-сайты, изучая реальные примеры сетевого самовыражения и диалоги BlogSum составляет информационные «выжимки» имеющие прямое отношение к поставленному вопросу.

Тексты, написанные с использованием неформального языка, создают ряд специфических проблем на пути их компьютерного анализа. Блоги, форумы, чаты и пр. содержат мнения, эмоции, отвлеченную болтовню, а также переполнены ошибками правописания и неправильной грамматикой.

Предложенное средство реферирования способно решать две главные проблемы: определять предложения, не имеющие отношения к основному вопросу, и те, смысл которых неясен. Тестирование BlogSum путем компьютерной оценки релевантности, а также с привлечением экспертов-людей показало высокую эффективность предложенных алгоритмов, позволяющих сортировать и фильтровать предложения, успешно превращая огромные массивы невразумительного текста в простые для восприятия резюме.