`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

PROMT 7.0

0 
 

Системы машинного перевода, существующие уже не первый год, постоянно обновляются и совершенствуются. Сегодня они не просто упрощают доступ к интернет-ресурсам -- их предлагают использовать в промышленных масштабах как инструментарий профессиональных переводчиков. В связи с этим появление на рынке новой версии PROMT представляет большой интерес.

Отрадно, что машинные переводчики являются одним из немногих успешных сегментов индустрии программного обеспечения на постсоветском пространстве, особенно принимая во внимание их востребованность. Сегодня мы познакомимся с новой версией, пожалуй, наиболее известного продукта (вернее, даже целого семейства) данного класса -- PROMT 7.0.

Таблица 1
Таблица 2
Система PROMT известна на рынке давно и является, наверное, самой популярной у пользователей разных категорий благодаря высокому качеству перевода. Последняя версия призвана еще больше упрочить ее позиции за счет прежде всего полностью переработанных алгоритмов перевода, учитывающих новые грамматические правила, возможности использования баз переводов, расширенных специализированных словарей и шаблонов тематик.

На сегодняшний день пользователям предлагаются три основные версии PROMT 7 -- Professional, Translation Suite и Expert. Последняя предназначена для интеграции с системами класса Translation Memory (TM) от компании TRADOS и позволяет объединить в одну технологическую цепочку поиск сегментов переводимого текста в выбранной базе TRADOS, экспорт ненайденных сегментов в систему PROMT для машинного перевода и последующий их импорт из PROMT назад в базу переводов с целью ее пополнения и коррекции. Впрочем, такая организация работы (как правило, коллективной) выходит за рамки настоящей статьи, к тому же программное обеспечение TRADOS должно приобретаться отдельно.

PROMT 7.0Две другие редакции более традиционны, в зависимости от комплектации они поддерживают до 10 направлений перевода -- с английского, немецкого, французского, испанского, итальянского на русский и обратно -- как в пакетном, так и в интерактивном режиме. Предусмотрена также возможность голосового воспроизведения текста, что может оказаться актуальным для пользователей, привыкших выполнять несколько дел одновременно.

PROMT 7 Professional содержит удобную утилиту SmartTool для интеграции с продуктами Microsoft Office, благодаря чему позволяет осуществлять перевод не только в специальном окне PROMT, но и непосредственно в рабочем окне документа, а также встроенную OCR-систему для обработки графических и PDF-файлов и функцию перевода XML-документов по специальным правилам. Последняя поддержана механизмом макросов, которые могут создаваться на нескольких языках и обращаться к объектной модели документа, а используются чаще всего с целью подключения специальных препроцессоров для предварительной разметки текста.

Хотя версия PROMT 7 Translation Suite лишена этих дополнительных компонентов, на самом деле она дороже и больше ориентирована на профессионалов, поскольку в ней реализована полноценная TM-система (а в Professional -- ее сильно урезанная версия), подробнее этот аспект будет рассмотрен ниже.


Машинный перевод

PROMT 7.0
PROMT предоставляет удобный доступ ко всей своей словарной базе
PROMT 7.0
PROMT 7 Translation Suite наиболее органично сочетает машинный перевод и Translation Memory -- ведь ни один из подходов не является панацеей
PROMT 7.0
В базе переводов собраны обороты и целые фразы, характерные для деловых документов
Описание машинных переводчиков, конечно, не может быть полным без примеров. В ходе изучения RPOMT 7 использовались многочисленные тексты различных тематик, и следует отметить, что фрагменты общего характера, как разговорного, так и книжного стиля, переводятся достаточно хорошо, с соблюдением всех правил синтаксиса. В некоторых случаях все же требуется заменить вручную несколько слов в итоговом абзаце, что для машины -- достаточно приличный результат. Обращает на себя внимание также то, что, в отличие от многих конкурентов, данный переводчик действительно пытается согласовывать все слова в переведенных предложениях. Не возникает проблем, как правило, и с деловыми документами, PROMT 7 даже пробует давать трактовку неоднозначных терминов исходя из контекста -- пусть не всегда верно, но выбрать наиболее подходящий вариант не составляет труда. Хуже, что по непонятным причинам список альтернатив не всегда оказывается полным.

Характерный пример, демонстрирующий качество нового переводчика, приведен в табл. 1. Обратите внимание, насколько гладким по сравнению с предыдущей версией и Pragma получилось последнее предложение -- это именно то, что обещали разработчики. Однако так происходит, к сожалению, не всегда -- во втором предложении, переведенном с помощью шаблона "Информатика", невозможно адекватно объяснить появление множественного числа союзного слова которые, да и предпочтительный перевод code как кодекс выглядит странно, ведь для данной предметной области приоритет, очевидно, должен иметь код. Кроме того, некоторые слова (выделены подчеркиванием) все же остаются несогласованными. Обратите также внимание, насколько влияет правильный выбор тематики на перевод даже такого простого текста.

В табл. 2 приведены примеры перевода фрагментов различных тематик с использованием соответствующих шаблонов. Они позволяют лишний раз убедиться в том, что с текстом, содержащим специальные термины, а также со сложными грамматическими конструкциями возникают дополнительные проблемы.

О безличных предложениях, столь характерных для технической литературы на русском языке, вообще пока говорить сложно -- избегать многократного повторения местоимений это, этот и пр. машинным переводчикам, по-видимому, удастся еще не скоро. Кроме того, программа пытается согласовывать слова только в пределах одного предложения.

Впрочем, все фрагменты переведены довольно внятно, настолько, что даже неквалифицированный пользователь поймет, о чем идет речь. А от отдельных огрехов несложно избавиться -- скажем, чтобы получить безукоризненный перевод примера из области филологии, достаточно добавить в пользовательский словарь пару терминов и одно словосочетание -- они пригодятся и в дальнейшем. В некоторых случаях, однако, хотелось бы получать от системы несколько возможных вариантов перевода, например для герундия и инфинитива -- как прямой, так и оформленный с помощью типичных грамматических конструкций. Это существенно упростило бы последующую доработку текста, скажем, в масштабах абзаца или даже всего документа.

Когда же перевод вызывает много нареканий, придется обратиться к простому и хорошо известному способу его коррекции: упростить текст, разбив сложные предложения на более короткие, выделить зарезервированные слова, добавить недостающие термины в пользовательский словарь, подключить и упорядочить дополнительные словари, в том числе и созданные во время работы над аналогичными проектами, и повторить перевод. На такую предварительную подготовку действительно стоит потратить время -- результатом будут более верная интерпретация терминов и снижение числа смысловых ошибок в переведенном тексте. По-видимому, систематически работая над настройкой системы (особенно в рамках определенной предметной области), со временем можно добиться стабильного перевода с достаточным качеством.

Центральное приложение пакета -- PROMT -- выполняет перевод типичных офисных документов с воссозданием всех стилей и шрифтов оригинала. В случае, когда в этом нет необходимости (требуется просто понять содержимое буфера обмена, текст сообщения или Web-страницы), можно воспользоваться более простым модулем, PromtX, который работает ощутимо быстрее и даже предоставляет возможность синхронного перевода набираемого текста. Однако при этом программа не определяет направления перевода автоматически.

Качество обратного перевода (с русского) во многом обусловлено вариативностью грамматических конструкций русского языка. Чем короче предложения и чем меньше сложных оборотов, тем лучше. Правда, в результате их перевода, например на английский, не удастся получить столь часто встречающихся в статьях и книгах сложноподчиненных предложений размером в четверть страницы. Но даже подстрочный перевод с характерными для носителей русского языка оборотами вполне возможно, затратив немного усилий, превратить из полуфабриката в приемлемый и удобочитаемый текст.


Базы переводов

Помимо собственно машинного перевода, в системе реализована еще и возможность задействования так называемых баз переводов, содержащих сегменты текста (к примеру, отдельные предложения) на входном и выходном языках. Эта технология носит устоявшееся название Translation Memory (TM), и ее главная идея состоит в повторном использовании однажды переведенных (предположительно качественно) фрагментов. Разбираться с ней проще всего на примерах, и для этого в поставку PROMT 7 Professional включены несколько по большей части демонстрационных баз с идиомами и характерными оборотами деловой лексики -- многие из них действительно постоянно встречаются в документах, и вряд ли стоит задумываться над ними снова и снова.

Наибольшие выгоды использование баз переводов сулит при постоянной работе над документами аналогичной структуры и тематики (договорами, полисами и пр.), в которых содержатся типовые обороты, условия, комментарии -- они будут просто целиком заменяться. В итоге и время сэкономится, и результат скорее всего получится более качественным.

Однако TM в PROMT 7 Professional реализована в несколько урезанном виде и даже носит другое название - Associative Memory (AM). Здесь применяются более простые алгоритмы выделения сегментов и их поиска (пользователь может указать минимально необходимое число совпадающих слов и максимально допустимое число вариантов). Полностью же возможности TM раскрываются в PROMT 7 Translation Suite. Данный продукт и ориентирован, в основном, на работу с базами переводов -- их создание, пополнение, тиражирование, организацию запросов и обработку записей.

Очевидно, что для использования данной технологии в промышленных масштабах требуются базы переводов достаточно большого объема -- иначе расходы на верификацию результатов окажутся неоправданно высокими. Для этого можно импортировать в систему заранее переведенные документы вместе с оригиналами, объединить наработки нескольких специалистов и пр. -- все необходимые инструменты, конечно же, предусмотрены. Следует только учесть, что подключаемые к проекту базы должны иметь совпадающие с точностью до диалекта входной и выходной языки.

Теоретически использование действительно огромных баз переводов позволяет даже реализовать работу с новыми языковыми парами -- исключительно средствами TM. Хотя, на наш взгляд, это, скорее, гипотетическая возможность, и вряд ли стоит ее серьезно принимать в расчет, особенно если речь идет о разных языковых группах.


Словари и шаблоны

Как уже упоминалось выше, полноценная работа над переводом невозможна без подключения и пополнения разных словарей, в том числе и специализированных тематических -- определенный их набор входит в каждую версию PROMT 7, остальные нужно приобретать отдельно. Все это богатство может использоваться и в качестве обычного электронного словаря, который даже подключается к Microsoft Word -- в результате все варианты перевода любого известного слова (во всех возможных словоформах) будут доступны из контекстного меню. К сожалению, поиск перевода выполняется довольно медленно.

Не менее полезны и так называемые шаблоны тематик, описывающие приоритеты подключенных словарей и препроцессоров, содержащие настройки правил перевода, списки зарезервированных слов, признаков транслитерации незнакомых слов и ключевых слов для автоматического определения тематики. Использование наиболее подходящего шаблона может существенно повлиять на качество перевода.

Для создания и редактирования пользовательских словарей в системе PROMT предназначено специальное приложение -- Dictionary Editor. Здесь можно вводить и редактировать словарные статьи, копировать и перемещать их из одного словаря в другой, выполнять поиск. Незнакомое слово удобно добавлять непосредственно из рабочего окна, содержащего машинный перевод текста. При этом в словарь автоматически заносятся все словоформы, выбирается раздел семантики, указываются дополнительные особенности (использование артикля, возвратность, залог, степени сравнения и пр. в зависимости от части речи) и задается переводной эквивалент (активный или неактивный).


И в заключение...

Помимо технических подробностей, несомненный интерес также представляет и более общий вопрос: смогут ли современные системы машинного перевода наконец-то разрушить все языковые барьеры? С сожалением приходится признать, что это -- дело весьма отдаленного будущего. PROMT 7 по-прежнему является наиболее развитым продуктом данного класса, но, даже несмотря на явный прогресс, он также заслуживает изрядную толику скепсиса. И тем не менее в определенных ситуациях машинный перевод удобен и вполне приемлем, например, когда нужно быстро понять смысл текста на малознакомом языке, или конфиденциальный документ нежелательно передавать кому бы то ни было.

Реализация технологии TM позволила приступить к освоению еще одной ниши -- массовой подготовки типовых документов, так что PROMT 7, особенно версия Translation Suite, вероятно, окажется востребованной в различных бюро и конторах. Но в данном случае, естественно, нужно принять во внимание начальные затраты на формирование представительных баз переводов (как и на организацию собственных специализированных словарей) -- впрочем, не исключено, что когда-нибудь их можно будет просто приобрести.

Главной же проблемой для систем машинного перевода по-прежнему остается "олитературивание" результирующего текста -- ведь они в принципе не способны выйти за рамки (и весьма жесткие) предписанных грамматических конструкций, и даже на документе в несколько страниц это уже бросается в глаза. Поэтому профессиональные переводчики пока могут спать спокойно -- машинные системы им еще не конкуренты, хотя в подмастерья уже вполне годятся.

Продукты предоставлены компанией "СОФТПРОМ":
тел./факс (044)242-5300,
www.softprom.com
PROMT Standard 7.0 "ГИГАНТ" -- 1224 грн,
англ.-рус.-англ. -- 642 грн;
PROMT Professional 7.0 "ГИГАНТ" -- 3240 грн,
англ.-рус.-англ. -- 1944 грн;
PROMT Expert 7.0 "ГИГАНТ" -- 5177 грн,
англ.-рус.-англ. -- 3882 грн;
PROMT Translation Suite "ГИГАНТ" -- 4529 грн,
англ.-рус.-англ. -- 2592 грн

0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT