Голосовые интерфейсы Dragon стали доступны украинским пользователям мобильных устройств Apple

27 сентябрь, 2012 - 13:02Елена Дериева

Компания Nuance представила в Киеве программные продукты Dragon Dictation и Dragon Search с поддержкой украинского языка для iPhone, iPod touch и iPad. Эти удобные инструменты с 26 сентября 2012 г. можно бесплатно загрузить из украинского магазина приложений App Store.

Голосовой интерфейс — самый естественный способ коммуникации человека, в том числе и с компьютером, планшетом, смартфоном. Технологии распознавания речи развиваются уже около полувека, и теперь, с переносом в «облако», они стали доступны для большого числа обладателей мобильных устройств.

Компания Nuance является лидером софтверного рынка, это один из крупнейших поставщиков систем распознавания речи, идентификации голоса, синтеза речи, интеллектуального ввода текста и оптического распознавания символов. В ее портфеле более 4 тыс патентов и патентных заявок, а объем продаж в 2011 г. достиг $ 1,4 млрд. Технологии Nuance взяли на вооружение более двух третей компаний рейтинга Fortune 500.

Голосовые интерфейсы Dragon стали доступны украинским пользователям мобильных устройств Apple

Раймунд Шмальд, маркетинг-менеджер мобильного направления Nuance Communications в Европе, на Ближнем Востоке и в Африке. «Практически во всех странах, где запущены Dragon Dictation и Dragon Search эти программы удерживают места в тройке лидеров бесплатно загружаемых программ. Это свидетельствует об энтузиазме, с которым воспринимают пользователи голосовое управление интерфейсом, уже сейчас пользователи надиктовывают миллиарды слов на разных языках, используя «облачные» технологии Nuance. Мы очень рады, что доступ к нашим программам расширяется, принося мощные технологии Dragon на быстро развивающиеся рынки, в том числе украинский»

На самом деле многие, в том числе и в нашей стране, сами того не подозревая, используют технологии Nuance, компания активно лицензирует свои продукты сторонним производителям ПО и оборудования. Их применяют для обслуживания клиентов контакт-центров (для получения типовой информации в обход громоздких меню IVR), внедряют в поисковые и управляющие модули автомобильных систем и GPS навигаторов, управляющие модули телевизоров и МФУ. Решения Nuance реализованы в более чем в 50 млн GPS, 70 млн автомобилей, 5 млрд гаджетов. Значительную долю доходов компании (около 40%) приносит сегмент здравоохранения, где голосовые технологии применяются для транскрипции данных и делопроизводства (врачу не приходится часами заполнять карты пациентов и листы назначений, их просто надиктовывают — дальнейшее распознавание и внесение в электронную документацию производит ПО).

Первые решения ввода текста Dragon Dictation и поиска Dragon Search для мобильных устройств были выпущены в конце 2009 г., и только за первый год их загрузили 7 млн человек. Со временем спектр поддерживаемых языков расширялся, в прошлом году был добавлен поддержка русский язык, а сейчас — украинский, таким образом, сейчас программы умеют работать с 37 языками разных семей и групп. В работах по обеспечению поддержки украинского языка были задействованы украинские компании, но только для сбора черновой информации (аудиозаписи разных текстовых фрагментов и их транскрипции) для обучающих выборок. Обработкой полученной базы и составлением словарей для украинского языка занимались специалисты самой компании Nuance.

Итак, Dragon Dictation поддерживает последнюю версию iOS 6, имеет всплывающие панели инструментов с значками программ, которые позволяют пользователю легко перемещаться между SMS, почтовыми службами, соцсетями, буфером обмена; а SMS, сообщения электронной почты, заметки, новые статусы и сообщения в соцсетях теперь можно просто надиктовать. Dragon Search позволяет просто произнести поисковый запрос — и найти информацию, при этом функция Dragon Search Carousel обеспечивает быстрый и эффективный поиск в разных каналах (Google, Yahoo!, Twitter, iTunes, Wikipedia и YouTube) без повторного ввода запроса. Конечно, обе программы позволяют откорректировать распознанный текст вручную, и, поскольку это системы самообучаемые, со временем качество распознавания увеличивается.

Пока мобильные системы распознавания речи доступны только для владельцев мобильных устройств Apple, но уже ближайшие два месяца компания Nuance намерена предложить хостируемый сервис для всего сообщества разработчиков мобильных приложений, и тогда можно ожидать выпуска аналогичных решений для аппаратов на других мобильных платформах. Впрочем, отдельными мобильными разработками на основе технологий Nuance уже можно воспользоваться. Например, Dragon Go! (для Android), своего рода аналог Siri, в которой реализованы помимо технологий распознавания голоса собственные разработки Dragon в области семантического анализа. Это приложение понимает довольно сложные вопросы, выполняет поиск одновременно на нескольких сотнях мобильных ресурсов, и предоставляет точные ответы на вопрос, а не множество связанных рекламных объявлений и списка возможных ссылок не ресурсы с релевантной информацией. Еще один интересный пример — iTranslate, российская разработка, которая воспринимает речь, переводит ее, а затем озвучивает перевод.

В ходе презентации Александр Питерман, основатель украинского сообщества пользователей iPhone и iPad, ukrainianiphone.com продемонстрировал основные инструменты Dragon Dictation и Dragon Search. «За менее чем два месяца пользования стало совершенно очевидно, насколько удобно применять голосовой интерфейс ввода для всех задач, которые ранее решались только с помощью не всегда доступной виртуальной клавиатуры. Особенно впечатляет то, насколько программа быстро учится, адаптируясь к особенностям произношения, словарному запасу и потребностям конкретного пользователя».

Распространяя мобильные Dragon Dictation и Dragon Search бесплатно, компания Nuance не просто значительно расширяет аудиторию — она делает привычным для мобильных пользователей применение голосовых систем, что, безусловно, будет способствовать улучшению основных технологий распознавания речи (за счет обратной связи), созданию экосистемы Nuance Mobile Developer Program, а также продвижению продуктов и услуг компании в коммерческих сегментах.