Машинные алгоритмы сделали новый шаг к пониманию человеческого общения

30 декабрь, 2021 - 15:15

Инженер из Центра обработки речи и языка Джона Хопкинса (CLSP) разработал подход, который в конечном итоге может помочь компьютерам «понимать» устный или письменный текст Language Understanding, LU) почти так же, как это делают люди.

Анализируя общение между людьми, научный сотрудник CLSP Пётр Зеласко (Piotr Zelasko) заметил, что многие алгоритмы обработки естественного языка работают хорошо только с чётко структурированным текстом, например, когда человек использует в речи полные предложения. Однако в реальной жизни люди редко говорят так формально, и это затрудняет системам LU точное определение того, где предложение начинается и где заканчивается.

Новая модель, предложенная им, учитывает различные переменные, такие как знаки препинания, что помогает ей определять смысл слов и распределять их по таким категориям, как «Утверждение», «Вопрос» или «Прерывание» в окончательной расшифровке стенограммы. Такая процедура,  называемая «распознаванием акта диалога», предоставляет другим моделям более организованную и сегментированную версию текста для работы.

«Этот новый метод означает, что LU-системам больше не приходится иметь дело с огромными неструктурированными фрагментами текста, – сказал Зеласко, чья статья недавно была опубликована в Трудах Ассоциации компьютерной лингвистики.  С ним мы хотя бы можем найти «элементарные блоки» разговора. Это может помочь в большом количестве задач, таких как обобщение, распознавание намерений и выявление ключевых фраз».

Учёный надеется, что его модель в конечном итоге окажется полезна компаниям, использующим речевую аналитику – процесс получения информации на основе анализа взаимодействия между клиентами и представителями службы поддержки клиентов.  Речевая аналитика обычно включает автоматическую транскрипцию разговоров и поиск по ключевым словам, что, по словам Зеласко, предоставляет ограниченные возможности для понимания.

Новый подход также когда-нибудь сможет облегчить работу врачей, сэкономив им драгоценное время, которое они тратят на заметки во время общения с пациентами. Устройство с новой моделью могло быстро просматривать стенограмму разговора, заполнять формы и составлять заметки автоматически, позволив врачам сосредоточиться на своих пациентах.