PROMT 9.0: для профессионалов и бизнесменов

1 октябрь, 2010 - 12:08Елена Дериева

Сегодня с системами машинного перевода (МП) так или иначе знакомы практически все пользователи. Соответствующие онлайновые службы встраиваются в самые разнообразные прикладные программы, хотя наибольший охват аудитории обеспечивают, конечно же, браузеры. Однако, несмотря на отсутствие революционных прорывов в области МП, развивается и традиционное настольное ПО, готовое стать верным помощником даже профессиональному переводчику.

PROMT 9.0 для профессионалов и бизнесменов
Набор словарей – основа формирования тематик, более тонкая настройка осуществляется за счет определения зарезервированных терминов и подключения правил перевода

Обычно обновляемая раз в два года система машинного перевода PROMT задержалась на уровне 8-й версии (включая релиз 8.5, ko.com.ua/42925) несколько дольше, зато разработчикам, похоже, удалось накопить кое-какой потенциал. Собственно ядро перевода PROMT 9 претерпело заметные изменения: помимо экстенсивных усовершенствований (улучшена обработка сложных семантических моделей, переработаны и дополнены лингвистические базы), в нем также применены корпусные и статистические методы (данное направление развивает, в частности, Google). Адекватно оценить объем таких новаций довольно трудно, хотя эффект в общем-то виден – перевод стал более гладким и связным, особенно когда речь идет об обработке конструкций, содержащих омонимы (представляющие разные части речи), такие неоднозначные служебные слова, как that, as, притяжательные местоимения, имена собственные, даты, время, цвета. С типовыми образцами непосредственных улучшений в переводе можно ознакомиться в официальном документе.

Также по общему впечатлению PROMT 9 быстрее предыдущей версии обрабатывает большие файлы, скажем, на перевод технической документации объемом 540 страниц ушло около получаса. Если при этом удается обеспечить приемлемое качество «подстрочника», то экономия на чисто технических операциях становится заметной. Еще одно наблюдение: с английским языком программа работает и оперативнее, и лучше, чем с остальными направлениями (табл. 1). Когда же предметная область находится на стыке разделов знаний, определенно нужно позаботиться о подготовке узкоспециализированных словарей. В одном из наших экспериментов дополнение тематики «Финансы» всеми имеющимися в наличии математическими словарями не помогло добиться корректного перевода терминов из финансовой математики. В целом же правильный подбор тематик оказывает заметное влияние на качество перевода (табл. 2), и это одно из очевидных направлений развития PROMT 9.0 – теперь пользователь может выбирать из пяти конфигураций с поддержкой шести языков (английский, немецкий, французский, итальянский, испанский, русский) и разными наборами специализированных словарей (до 123 тематик).

Клиентские приложения PROMT 9 могут встраиваться в Microsoft Outlook и основные приложения Microsoft Office (версия 2010 пока не поддерживается), OpenOffice.org, Adobe Acrobat/Reader, ICQ, Skype, QIP, MSN Messenger. Однако при работе с документами различных форматов необходимо учитывать особенности их формирования. Например, качество перевода PDF во многом зависит от того, каким образом расставлены переносы («жесткий» дефис программой не воспринимается) и как документ разбит на абзацы (перевод строки программа интерпретирует как конец предложения, соответственно, количество ошибок и неточностей заметно увеличивается). К сожалению, подобные нюансы все еще не редкость, и разработчики могли бы учесть наиболее частые из них. Впрочем, также понятно, что нельзя объять необъятное, поэтому перед отправкой в перевод большого документа нелишне вначале поэкспериментировать с каким-то его фрагментом.

PROMT 9.0 для профессионалов и бизнесменов
Управление базой знаний переводчика и доступом к ним сосредоточено в специальном приложении для лингвистического администратора

Всю продуктовую линейку PROMT можно разбить на три группы: для индивидуальных пользователей (от домашних до профессионалов), для переводческих бюро, для обычных компаний, в которых перевод не является основной деятельностью. Формирование последней отражает тенденции глобализации и интеграции современного бизнеса. При этом задачи, стоящие перед компаниями, выходящими на мировой рынок или взаимодействующими с зарубежными партнерами, можно условно разделить на два класса: оперативное ознакомление с документом на иностранном языке (когда поток такой деловой корреспонденции достаточно велик) и точный профессиональный перевод в формате исходного документа для последующего использования или распространения.

Для решения задач первого типа предлагается PROMT Translation Server (PTS) Intranet Edition 9.0 – эта система развертывается и работает централизованно на сервере, а доступ к инструментам перевода осуществляется через веб-интерфейс (поддерживаются браузеры Internet Explorer, Mozilla Firefox, Opera) и внутри локальной сети, и (при соответствующей настройке) извне. По сути, схема такая же, как у бесплатного сервиса translate.ru: с рабочего места пользователя на сервер с PTS отправляется запрос на перевод, который в зависимости от загрузки обрабатывается либо помещается в очередь на обслуживание. Однако на PTS-сервере применяются новейшее ядро, специализированные словари (в том числе пользовательские), единая корпоративная база переводов.

На качественную подготовку документов в рамках компании рассчитан PROMT NET Professional 9.0. Он пригодится как профессиональным переводчикам, так и квалифицированным специалистам, способным сформировать терминологическую базу, обеспечить сходную стилистику и внутренние стандарты. При этом речь идет вовсе не о замене персонала на системы МТ, а о минимизации времени на первичную обработку текста, обращение к словарям, поддержку используемых форматов, т. е. о повышении производительности труда. Затраты на окончательное редактирование перевода также могут снизиться, особенно при активном задействовании технологии Translation Memory, однако надо иметь в виду, что последнее предполагает определенный период накопления базы эталонов и обучения пользователей. В целом, по оценкам самих разработчиков, применение PROMT 9 сокращает время на профессиональный перевод документов примерно на 25%. На самом деле можно добиться даже большей экономии, прибегнув к пакетной обработке, выполняемой в фоновом режиме, причем для каждого исходника можно задать собственные параметры – от направления и тематики перевода до формата результирующего документа и пр.

PROMT 9.0 для профессионалов и бизнесменов
Удобство использования PROMT обеспечивают подключаемые модули для популярных приложений

В архитектурном плане PROMT NET Professional радикально отличается от PTS. В этом случае сервер выполняет лишь второстепенные задачи, к которым относятся управление лицензиями и доступом, хранение словарных баз и персональных настроек. А на рабочие станции устанавливается клиентское приложение, функционально соответствующее персональному PROMT NET Professional 9.0. Авторизация пользователей в такой распределенной системе производится средствами Windows, внутри PROMT учетным записям назначаются три стандартные роли: администратор, лингвистический администратор и пользователь (права последнего ограничены доступом исключительно к клиентской части PROMT). Как обычно, обеспечивается достаточно гибкое централизованное управление лицензиями, в том числе параллельными, что позволяет подобрать оптимальную схему и застраховаться от определенных ситуаций (когда, к примеру, пользователю англо-русского ПО вдруг понадобится перевод с немецкого).

Пожалуй, наиболее существенным архитектурным ограничением PROMT NET Professional является необходимость использования Windows Server для серверного компонента – потенциальным заказчикам, вероятно, имеет смысл заранее задуматься о применении для подобных целей виртуальных машин в рамках соответствующих лицензий Microsoft. При этом, однако, доменная архитектура не требуется, документация содержит необходимые сведения для развертывания системы в рамках одноранговой сети.

В PROMT NET Professional 9.0 предложен новый механизм настройки перевода на основе выбора тематики переводимого текста, управление которым полностью ложится на плечи лингвистического администратора. Именно он определяет, какой перечень тематик и словарей может применять каждый пользователь, а также права этих пользователей по пополнению имеющихся баз данных и специализированных словарей. В вeдении лингвистического администратора также находится формирование новых тематик на основе общих и специализированных словарей и загрузка их в/из архива. Естественно, создать словарь для персонального применения вправе любой пользователь PROMT, но лингвистический администратор посредством соответствующих инструментов сравнения и слияния может на основе разрозненных источников сформировать общий словарь узкоспециализированной лексики либо с помощью программы извлечения терминологии из текста (с сохранением контекста, в котором она применяется) заранее позаботиться о наличии единого глоссария для конкретного проекта.

Для мобильных пользователей, не подключенных к сети и не имеющих возможности постоянного доступа к серверу, предусмотрено специальное приложение для синхронизации данных – этот компонент приобретается отдельно и выполняет перенос выбранных словарей, тематик и баз между локальным ПК и сервером.

Таблица 1. Результаты перевода в пакетном режиме с использованием тематик «Информатика и вчт» для двух языков
Английский Typographical conventions

Menu commands and dialog box components are identified with bold type throughout this manual. For example, File > New refers to the command New in the File menu.File names are given as follows: C:IMAGESBEACH.JPGThe Enter key is represented by (¶), the arrow keys by (ж), (Ж) etc. To enter a key combination such as (Alt)(F), press the (F) key while holding down the (Alt) key.Important: Especially important notes or useful tips are highlighted like this.
Типографские соглашения

Команды меню и компоненты диалогового окна идентифицируются с жирным шрифтом всюду по этому руководству. Например, Файл> Новый обращается к команде New в меню File.Имена файла даются следующим образом: C:IMAGESBEACH.JPGКлавиша Enter представляется (¶), клавишами со стрелками (Ф), (ф) и т.д. Ввести a сочетание клавиш, такое как (Alt) (F), нажмите (F) клавишу в то время как удержание (Alt) ключ.Важный: Особенно важные примечания или полезные подсказки выделяются как это.
Немецкий Schreibweisen

Menubefehle werden in diesem Handbuch durch Fettdruck gekennzeichnet. Datei > Neu bezeichnet beispielsweise den Befehl Neu im Menu Datei.Bestandteile eines Dialogfensters sind ebenfalls fettgedruckt. Zum Beispiel: „Wahlen Sie in der Liste Name einen Dateinamen und klicken Sie auf die Schaltflache OK."Dateinamen werden folgenderma?en dargestellt: C:BILDERSCHULZ.JPGDie Eingabetaste wird als (?) dargestellt, die Richtungstasten als (?), (?) etc.Um eine Tastenkombinationen wie beispielsweise (Alt)(F) einzugeben, betatigen Sie die Taste (F) bei gedruckter Alt-Taste.
Стили

Команды меню характеризуются в этом руководстве жирной печатью. Файл > По-новому обозначает, к примеру, команду По-новому в меню Файл.Составные части окна диалога также напечатаны жирным шрифтом. Например: „Выбирать Они в списке имя имя файла и Вы нажимаете кнопку ОК."Имена файлов представляются следующим образом: C:BILDERSCHULZ.JPGКлавиша ввода представляется как (?), клавиши направления как (?), (?) и т. д.Чтобы давать комбинации клавиш как (Alt)(F), приводят в действие Они клавишу (F) при нажатой клавише Alt.
Таблица 2. Перевод технической документации, демонстрирующий влияние нерелевантной тематики на его качество в части, не относящейся к терминологии
Оригинал на английском Оригинал на русском Перевод PROMT, тематика «Информатика и вчт» Перевод PROMT, тематика «Бизнес»
TEST "VIRUS" EICAR AND ITS MODIFICATIONS

This test «virus» was specially developed by (The European Institute for Computer Antivirus Research) for the testing of anti-virus products.
ТЕСТОВЫЙ «ВИРУС» EICAR И ЕГО МОДИФИКАЦИИ

Тестовый «вирус» был специально разработан организацией (The European Institute for Computer Antivirus Research) для проверки работы антивирусных продуктов.
ПРОТЕСТИРУЙТЕ «ВИРУС» EICAR И ЕГО МОДИФИКАЦИИ

Этот тест «вирус» был особенно разработан (Европейский Институт Компьютерного Исследования Антивируса) для тестирования антивирусных продуктов.
ПРОВЕРЬТЕ «ВИРУС» МОДИФИКАЦИИ ITS И EICAR

Этот тест «вирус» был особенно развит (Европейский Институт Компьютерного Антивирусного Исследования) для тестирования антивирусных продуктов.
Never use real viruses for testing the operation of an anti-virus product! Никогда не используйте в качестве проверки работоспособности антивирусного продукта настоящие вирусы! Никогда не используйте реальные вирусы для того, чтобы протестировать работу антивирусного продукта! Никогда не используйте реальные вирусы для того, чтобы проверить работу антивирусного продукта!
The application identifies the file downloaded from the EICAR site as an infected object containing a virus that cannot be disinfected and performs the actions specified for this type of object. Программа идентифицирует файл, загруженный с сайта компании EICAR, как зараженный объект, содержащий не подлежащий лечению вирус, и выполняет действие, установленное для такого объекта. Приложение идентифицирует файл, загруженный с сайта EICAR как зараженный объект, содержащий вирус, который не может быть дезинфицирован и выполняет действия, определенные для этого типа объекта. Применение идентифицирует файл, загруженный с сайта EICAR как зараженный объект, содержащий вирус, который не может быть дезинфицирован и выполняет действия, указанные для этого типа объекта.