`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

Pragmaтичный переводчик

0 
 

Изучение иностранных языков становится все более актуальной задачей в связи с дальнейшим развитием информационных технологий -- благодаря Internet мы получили доступ к великому множеству интересных и полезных сведений, но только малая часть их представлена на русском и украинском. К сожалению, знаний, приобретенных в школах на уроках иностранных языков, практически всегда недостаточно. И здесь на помощь приходят системы машинного перевода, существующие уже не первый год, но пребывающие в процессе постоянного совершенствования.

Одной из последних новинок рынка машинных переводчиков является программа Pragma 3.0 от компании Trident Software, в которую включены английский, русский, немецкий и украинский языки с возможностью перевода в любом направлении. В ней используются оригинальные словари (общий и около 100 тематических), содержащие более 800 тыс. слов и выражений, что позволяет надеяться на приличный результат.

Pragmaтичный переводчик Pragma представляет собой интегрированный набор программных компонентов. Догадаться об этом можно уже на этапе загрузки с сайта разработчика -- различные конфигурации формируются простым добавлением необходимых модулей к базовой системе. Pragma не имеет отдельной среды перевода, она встраивается непосредственно в приложения, так или иначе предназначенные для работы с текстом, в том числе в Microsoft Word, Microsoft Outlook, Outlook Express, Internet Explorer, WordPad, Notepad. Следует отметить, что список поддерживаемых приложений постоянно расширяется -- совсем недавно в их число попали OpenOffice.org и StarOffice. Впрочем, не стоит огорчаться и пользователям других программ -- в Pragma также имеется инструмент "быстрый перевод", транслирующий текст из буфера обмена.

Соответственно предлагаются несколько готовых комплектаций (базовая, для работы c Internet или с офисными документами), куда входят те или иные модули, словари и вспомогательные инструменты. Конечно же, отличаются они и ценой. По информации авторов, архитектура программы позволяет расширять количество языковых пар простым добавлением словарей для языков, родственных английскому и русскому, которые считаются базовыми в этой системе.

В целом работа с Pragma довольно проста: в любом из поддерживаемых приложений достаточно выделить фрагмент текста (в противном случае переводится весь документ) и воспользоваться меню Pragma. Программа позволяет указать направление перевода, задать размещение транслированного фрагмента в том же или отдельном файле, а также настроить другие параметры. Допускается выбирать определенную тематику текста, под которой понимается упорядоченный набор используемых словарей. Это можно сделать самостоятельно вручную либо положиться на автоматический выбор, осуществляемый программой на основе ключевых слов и прочих признаков. Обычно таким образом удается несколько улучшить качество перевода за счет более точной интерпретации терминов, снижения числа смысловых ошибок и увеличения количества связных предложений в результирующем тексте.

Примеры машинного перевода
Впрочем, "встраиваемый" характер системы имеет не только положительные (простота использования, привычная рабочая среда и пр.), но и отрицательные стороны. Так, наибольшая функциональность предоставляется лишь в мощных текстовых процессорах, т. е. пока в Microsoft Word и OpenOffice.org. Здесь Pragma, аналогично многим системам машинного перевода, выделит слова, отсутствующие в словаре, а также те, что допускают несколько вариантов перевода -- нужный легко выбрать парой щелчков мыши. Понятно, что в Notepad или WordPad такое реализовать нельзя в принципе, во всяком случае "малой кровью", однако без данной функции сколько-нибудь серьезная работа над переводом вряд ли возможна. В этой связи поддержка OpenOffice.org кажется особенно ценной -- в силу бесплатности продукта его легко приспособить как достаточно интеллектуальную среду перевода.

Pragmaтичный переводчик
Pragma практически не требует настройки, наибольшее число параметров доступно для Microsoft Word

Особое внимание стоит уделить корректору словарей. С его помощью правят перевод известных слов (в том числе выбирают предпочтительный вариант), добавляют неизвестные и даже создают новые тематики. Все изменения накапливаются в пользовательском словаре, который имеет более высокий приоритет по сравнению с системным. Собранную таким образом информацию можно сохранять и переносить на другие компьютеры посредством операций экспорта/импорта.

Пополнение словарей производится также довольно просто. Скажем, в Microsoft Word достаточно дважды щелкнуть на неизвестном слове (в переведенном фрагменте оно будет выделено красным шрифтом) и ввести нужную информацию в появившемся диалоговом окне. Процедура еще больше упрощается благодаря тому, что после каждой операции перевода Pragma автоматически заполняет списки нераспознанных или неоднозначно трактуемых слов (разделы "Не найдено" и "Варианты" соответственно). Естественно, допускается и корректировка словарей вручную. Таким образом, работа, как и в большинстве подобных систем, может выполняться итерационно по схеме: черновой перевод, коррекция словарей, чистовой перевод. Однако нужно учитывать, что Pragma (в отличие, например, от PROMT) не позволяет сразу описать полную парадигму слова, т. е. корректно распознаваться будет только непосредственно добавленный вариант.

Pragmaтичный переводчик
Работать с Pragma внутри текстовых процессоров вполне комфортно — можно быстро выбирать замены многозначных слов и добавлять перевод нераспознанных
Pragmaтичный переводчик
Корректор словаря, вопреки своей простоте, вполне удобен и полезен. Пожалуй, единственный недостаток — невозможность автоматического формирования полной парадигмы слова
Pragmaтичный переводчик
Система обновлений быть может сделана и не наилучшим образом, но она есть и работает
Наибольший интерес, тем не менее, представляет не эргономика или архитектура программы и даже не положенные в ее основу формальные принципы, а качество перевода. С точки зрения практического применения наиболее актуальными, на наш взгляд, являются русско-украинское, украинско-русское, англо-русское и англо-украинское направления перевода. Нами был проведен ряд экспериментов, и результаты некоторых из них, например правильного перевода деепричастного оборота с русского на украинский язык, весьма порадовали.

Примеры перевода текстов разного характера приведены в таблице (подчеркиванием выделены наиболее характерные моменты). Для сравнения здесь также даны результаты работы над теми же фрагментами других известных программ: промышленной системы русско-украинско-русского перевода "ПЛАЙ", созданной с привлечением специалистов института языкознания НАН Украины, и PROMT (использовался бесплатный сервис на Web-узле www.translate.ru). Никакой дополнительной настройки программного обеспечения или специальной подготовки словарей не производилось.

Первый пример взят из книги Е. А. Карпиловской "Вступ до комп'ютерної лiнгвiстики" (Донецк, "Юго-Восток", 2003) из-за его подробного разбора профессионалами. Несмотря на неизбежные ошибки, связанные скорее всего с переводом предложения по частям (несогласование родов слова "язык" и местоимений "нее" и "ее"), качество достаточно высокое (обратите внимание на верно переведенные "ранее обслуживаемые русским языком", "выработки" и пр.). Тестирование обратного направления в целом также дает хорошие результаты, смысл текста передается полностью, хотя некоторые обороты, как нам кажется, переводятся не наилучшим образом.

Несколько иначе обстоят дела при работе с английским языком. И дело тут, конечно же, не в недостатке словарной базы, а в принципиальных различиях грамматических конструкций.

Что касается фрагмента технического текста (пример 2), отнесенного к тематике "Информатика", то его смысл передан достаточно точно для того, чтобы даже не слишком квалифицированный пользователь понял, о чем идет речь. Однако в дальнейшем (для включения в отчет, реферат и пр.) такой перевод уже придется серьезно править.

В еще большей степени это касается текстов общей тематики в силу того, что в них чаще встречаются сложные грамматические конструкции. В частности, стоит обратить внимание на то, что, если имя существительное стоит в препозиции в роли определения (что типично для английского языка), как love fest в примере 3, желательно было бы получить несколько вариантов перевода всего словосочетания, не ограничиваясь только интерпретацией первого слова как прилагательного. То же можно сказать и о переводе причастий и герундия.

В процессе тестирования мы также сделали вывод, что Pragma в большей степени пытается олитературивать текст, что не всегда приносит адекватные результаты. В некоторых случаях перевод PROMT, хоть и напоминает подстрочник, для неквалифицированного пользователя может оказаться даже полезнее. Впрочем, все высказанные замечания ничуть не умаляют достоинств Pragma.

Вообще машинный перевод, как таковой, можно рассматривать с двух точек зрения -- профессиональной, предполагающей качественную подготовку и дальнейшее использование текста, и "бытовой", когда достаточно лишь добиться понимания общего смысла текста. Профессиональное применение сегодня абсолютно реально и оправданно для родственных языков, что последняя версия Pragma прекрасно демонстрирует на примере русского и украинского, хотя даже в этом случае требуется окончательная доводка текста (вероятно, ее объем будет уменьшаться по мере совершенствования программы и пополнения словаря).

С другой стороны, ни одна из известных нам компьютерных систем не обеспечивает стабильно удовлетворительного перевода с английского (или других германских языков) на русский или украинский либо наоборот. Эффективно использовать такие системы скорее всего сможет лишь человек, обладающий достаточными знаниями языков, хорошо разбирающийся в предметной области, способный корректно пополнять словарь и т. д. Чтобы получить действительно качественный результат, придется существенно перерабатывать переведенный текст, причем сверяясь с оригиналом, поскольку в отдельных сложных случаях смысл предложений попросту теряется.

Pragmaтичный переводчик
Pragma использует довольно емкие словари, а с подключением новых автоматически формируются и новые направления перевода

Изучение Pragma 3.0, нового продукта на рынке систем машинного перевода, лишний раз подтвердило тот факт, что, несмотря на постоянное совершенствование, программы-переводчики для языков, относящихся к разным группам, могут использоваться в основном лишь в качестве вспомогательного средства. Перевод -- творческий процесс, и пока здесь с человеком никто и ничто не сравнится.

Однако машинный перевод, даже в нынешнем состоянии, совершенно уместен, когда необходимо в целом ознакомиться с содержанием научно-технического или общественно-политического оригинала на малознакомом языке. И в данном вопросе Pragma вполне сможет помочь, особенно с учетом своей архитектуры, обеспечивающей быстрое и легкое подключение новых языковых пар.
0 
 

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT