Pragma 4.0: больше языков, меньше ошибок

1 декабрь, 2005 - 00:00Елена Дериева

Машинные переводчики по-прежнему привлекают наше внимание, поскольку все мы надеемся с их помощью хоть когда-нибудь преодолеть многочисленные и вечные языковые барьеры. К сожалению, как и вся отрасль искусственного интеллекта (ИИ), данное направление сегодня переживает период стагнации. Тем не менее даже экстенсивный путь сулит пользователям дивиденды, и особенно приятно, что не опускают руки отечественные разработчики.

Новая версия Pragma 4 от украинской компании Trident Software поддерживает пять языков: русский, украинский, английский, немецкий и латышский. В полном соответствии с изначальной идеологией развития пакет имеет модульную организацию, т. е. словари, грамматики, а также вспомогательные файлы для каждого языка помещены в отдельные модули. Всего же системные словари содержат более 1,8 млн статей по 110 тематикам, а расширенный словарь специальных терминов, охватывающий около 50 тематик, необходим для качественного перевода специальных текстов. Новый язык подключается простым добавлением соответствующего модуля, поэтому нужную конфигурацию подобрать легко.

Кстати, на Web-узле компании имеется интернет-служба, где можно оценить достоинства и недостатки перевода. Помимо указанных, она работает еще с пятью языками: голландским, итальянским, испанским, португальским и французским, – итого пользователю доступны 90 направлений перевода. Очевидно, разработчики таким образом обкатывают новые модули, и можно надеяться, что они в скором времени появятся и в автономной программе.

Следует отметить, что практически все направления перевода являются, так сказать, вторичными, кроме англо-русской пары. Эта пара изначально формировалась как основа системы перевода между языками славянской и германской групп с целью дальнейшего расширения путем добавления словарей для родственных языков. Например, украинско-английский перевод выполняется большей частью не напрямую, а с помощью русско-английских грамматических конструкций.

Pragma 4.0 больше языков, меньше ошибок
Pragma – один из немногих машинных переводчиков, который интегрируется с бесплатным программным обеспечением

Как и ранее, Pragma не имеет отдельной среды – программа встраивается непосредственно в приложения для работы с текстом: Microsoft Word, Outlook, WordPad, OpenOffice.org 1.х, Internet Explorer, Notepad. Инструмент быстрого перевода из буфера обмена особых изменений также не претерпел. К сожалению, то же относится и к корректору словарей: в нем по-прежнему не предусмотрена возможность одновременного ввода всей парадигмы слова, что, впрочем, может быть обусловлено специфичной структурой самого словаря. Также при корректировке необходимо учитывать регистр символов – от этого зависит их дальнейшее распознавание в тексте.

Впрочем, эргономика программы и вспомогательные инструменты не столь интересны, как качество перевода новой версии. По заявлению разработчиков, ядро Pragma 4 использует многоязычную технологию, которая сочетает в себе лучшие идеи старого подхода – двунаправленного и нового – многонаправленного. К сожалению, оценить, как программа справляется с текстами на латышском языке, нам было трудно, но по отношению к другим языковым парам мы не ограничивали себя в примерах, протестировав как фрагменты общей лексики, так и специальные тексты. Безусловно, наибольшее внимание было уделено самым актуальным направлениям: русско-украинскому, украинско-русскому, англо-русскому и англо-украинскому.

В целом качество перевода несколько повысилось – об этом свидетельствуют и результаты обработки фрагментов из предыдущих обзоров. Ей по плечу различные грамматические конструкции: причастные и деепричастные обороты, герундий, инфинитив и даже сложные предложения.

Pragma 4.0 больше языков, меньше ошибок
Перевод достаточно точный, однако наполнение словарей далеко не исчерпывающее

Корректное указание тематики несколько улучшает качество перевода, в основном за счет использования более подходящих терминов (а иногда и стандартных оборотов). Варианты теперь предлагаются не только для многозначных слов, но и для целых словосочетаний, правда, не всегда, но даже в таком виде это, безусловно, заметный прогресс. Как это ни удивительно, но многие недоработки проявляются именно при переводе на русский язык (хотя, повторимся, он является базовым). Например, иногда варианты для многозначных слов в русском языке даются в исходной форме, а не в той, которая используется в тексте (это предлагает даже тезаурус в программе Word). Порой возникают нюансы и с однородными определениями: последнее у них неожиданно оказывается несогласованным в падеже как с остальными, так и с существительным (или местоимением), к которому относится. Впрочем, описанные проблемы в большинстве случаев воспринимаются лишь как досадные огрехи, и даже несмотря на них в рамках одной языковой группы порой удается получить очень хороший вариант, ведь программа пытается олитературивать текст.

Что же касается перевода между языками разных групп, то, как мы отмечали в предыдущих публикациях, в ближайшее время вряд ли стоит ожидать существенных подвижек, – тем не менее в большинстве случаев Pragma 4 помогает понять смысл текста. Поэтому корректно говорить лишь об экстенсивном развитии, в общем-то, всех подобных продуктов, которое не позволяет современным системам машинного перевода подняться над уровнем вспомогательных средств. Ни одно из известных нам приложений не дает возможности получать стабильно качественный (с точки зрения конечного пользователя) перевод между языками разных групп. Что ж, будем следить за развитием данного направления ИИ и дальше.