+22 голоса |
Российская компания "Центр Речевых Технологий" сообщила, что первой в истории завершила работу над технологией распознавания слитной русской речи на 30,000 словоформ. Инновационная разработка "Руссограф", по заявлению ее создателей, открывает новые возможности в общении человека с техникой на русском языке.
Работы над проектом продолжались более 3 лет, а собственные инвестиции компании в разработку составили около 5 млн. долл.
Технология "Руссограф" создавалась с учетом фонетических и грамматических особенностей русского языка. Существующие на западе системы распознавания созданы для работы с английским, испанским и другими популярными языками и малоприменимы в работе с русской речью. Это связано с тем, что русский язык
принципиально отличается от других языков не только фонетически (например звуком "ы"), но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи. В результате использование западных технологий для качественного распознавания русской речи не
представляется возможным.
Для разработки технологии "Руссограф" была создана научно-исследовательская группа из специалистов по лингвистике, фонетике, математике, обработке сигналов и программировании. Для работы над проектом в ЦРТ использовали уникальный для России набор речевых баз данных, в который входят записи более чем 3000 дикторов общей длительностью около 300 часов, собранных с учетом 5 диалектных групп русского языка. Эти базы были использованы для создания акустических моделей звуков русской речи. Для создания языковых моделей в ЦРТ была собрана текстовая база русского языка объемом 35 миллионов слов.
Поскольку создание качественной системы распознавания невозможно без обширных экспериментальных исследований, в ЦРТ был развернут мощный вычислительный кластер с производительностью около 1012 операций в секунду. Важной частью проекта стало создание базового речевого декодера, который используя оригинальные акустические и языковые модели русского языка преобразовывает речевой сигнал в текст.
Промышленное внедрение технологии распознавания "Руссограф" отрывает новые возможности голосового управления компьютерной и бытовой техникой, промышленным оборудованием и транспортом; управления службами и сервисами по телефону; систематизации фонограмм и поиска по аудио архивам, а также
обеспечения безопасности людей и объектов. Особенно актуальной новая разработка может стать для тех русскоговорящих людей, чьи физические возможности ограничены.
Сейчас ЦРТ работает над аппаратной реализацией технологии. Уже в 2008 году компания предложит несколько продуктов построенных на основе технологии распознавания, в частности систему интерактивного голосового управления для контакт центров, а так же системы управления промышленными объектами.
В перспективе компания также планирует создание на базе технологий распознавания и синтеза карманного переводчика устной русской речи.
"Напомню, что в начале этого года, в своих прогнозах на развитие
компьютерных технологий второго цифрового десятилетия, Билл Гейтс назвал создание естественного интерфейса одной из приоритетных задач человечества, отметив, что технологическое будущее - за голосовым управлением и распознаванием речи. Технология распознавания русской речи "Руссограф",
разработанная в ЦРТ, создает основу для создания целой линейки инновационных продуктов в одном из наиболее перспективных сегментов рынка" - отметил генеральный директор "Центра Речевых Технологий" Михаил Хитров.
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365
+22 голоса |