Word, TeX и компания

22 октябрь, 2007 - 10:53Елена Дериева

Среди многочисленных и, отчасти, даже революционных изменений в Microsoft Word 2007 мы уже отмечали попытку привнести в этот великолепный текстовый процессор полиграфические технологии TeX и универсальный подход MathML. Однако Microsoft не была бы сама собой, если бы решила эту задачу «в лоб», без очередных изысканий в духе «лучше лучшего». В результате вопрос трансляции и переноса формул из Microsoft Word в издательские системы (и обратно), по-прежнему, остался открытым и для эффективного решения данных проблем необходимо применять сторонние разработки.

Word, TeX и компания
Пакет GrindEQ не только интегрируется в современный интерфейс Word 2007, но и успешно работает с новым форматом уравнений

Развитие настольных издательских систем до сих пор так и не сняло с повестки дня одну из достаточно важных проблем: как обеспечить эффективный набор текста для тех, кому периодически приходится изъясняться на языке математики. На сегодняшний день эти пользователи просто вынуждены быть мастерами на все руки, осваивая в той или иной мере наиболее распространенные приложения. Особенно актуальным на протяжении многих лет остается вопрос совместимости Word и TeX – уж слишком долга и успешна история применения последнего в печатном деле. Зачастую даже известные научные журналы используют один из первых пакетов расширений, AMS-TeХ, изначально созданный для весьма узкого применения – верстки математических статей и книг, издаваемых Американским математическим обществом.

Конечно, несложно понять издателей научной литературы, которые ориентированы прежде всего на удобство и надежность собственного технологического процесса и не торопятся внедрять более современные подходы и инструменты. Но отсутствие единых спецификаций принимаемых в печать материалов влечет за собой немало временных потерь и избыточных трудозатрат.

В то же время на рынке наблюдается немалое оживление, связанное с выходом 2007 Office System и предсказуемой массовой миграцией на этот пакет. Об этом свидетельствуют не только победные реляции самой Microsoft, но и общие тенденции рынка, в том числе и инспирированные выпуском Windows Vista. А принимая во внимание особые условия распространения 2007 Office System для студентов и преподавателей, нетрудно предугадать, что пользователей в том числе и нового текстового процессора в университетских кампусах значительно прибавится.

К тому же, специалисты из Microsoft, судя по всему, вполне искренне стремятся решить описанные проблемы. Так, в Word 2007 реализован новый прогрессивный интерфейс (и соответствующее внутреннее представление) для ввода формул и кое-какие другие полезные инструменты. Однако нет возможности конвертации даже между Microsoft Equation 2007 и Equation 3.х. Вероятно, существенным шагом на пути к унификации было бы внедрение именно MathML, рекомендованного консорциумом WWW, однако разработчики предпочли собственный адаптированный формат.

Таким образом, гарантированная совместимость может быть обеспечена только в рамках гомогенной системы, что далеко не всегда удобно. А в прочих случаях по-прежнему придется пользоваться специализированными конвертерами, которые уже в достатке имеются и для Word 2007.

Пожалуй, самым естественным дополнением Word 2007 в части работы с формулами является MathType, для которой недавно выпущена очередная 6-я версия. Программа полностью интегрируется в Word 2007, располагая свои инструменты на отдельной вкладке ленты и обеспечивая удобное создание формул (как в отдельном окне, так и непосредственно в документе), в том числе и с разного вида нумерацией, перекрестными ссылками и пр.

Допускается непосредственно из редактора экспортировать формулы MathType в основные форматы, используемые для обмена документами, в том числе, в наиболее распространенные варианты TeX: Plain TeX, AMS-TeX, LaTeX (версий 2.09 и новее), AMS-LaTeX. Результат определяется параметрами каждого из трансляторов, которые можно подстроить под свой вкус (либо создать конфигурационные файлы с помощью специальных скриптов).

И наоборот, опытные пользователи TeX теперь могут применить свои навыки, вводя хорошо знакомые текстовые команды непосредственно в окне MathType – программа автоматически преобразует их в соответствующие графические элементы. Таким образом, стандартные для TeX способы ввода можно легко сочетать с характерным для Word стилем работы мышью. К тому же функция вставки формул из готовых TeX-документов через буфер обмена в окно MathType решает проблему повторного использования готовых элементов.

Не обошли стороной разработчики и визуальные эффекты, предусмотрев возможность выделения цветом любого элемента внутри формул и сохранения этих параметров при конвертации во все поддерживаемые форматы.

Отдельно следует отметить новые возможности MathType 6, имеющие непосредственное отношение к распространению документа через Интернет, в первую очередь, технологию MathPage создания Web-страниц из документов Word. Благодаря ей математические символы и уравнения MathType, а также Equation Editor можно преобразовать в изображения (форматов GIF, EPS, WMF) с автоматической нумерацией результирующих файлов или в MathML. При этом первые обеспечивают максимальную совместимость, а последние позволяют, к примеру, переносить готовые формулы в современные системы компьютерной математики. К тому же, MathML стандартно поддерживается Firefox, а для других браузеров поддержка доступна в виде расширений.

Впрочем, для таких специализированных задач, как конвертация из одного формата документа в другой, целиком или частично, имеются и другие возможности. Например, GrindEQ, состоящий из набора полностью независимых компонентов, обеспечивает двустороннее преобразование между Word и LaTeX, и к тому же умеет функционировать в пакетном режиме. Новая 2007 версия полностью интегрируется в интерфейс Word 2007 и работает с форматами LaTeX, AMS-LaTeX, Plain TeX и AMS-TeX, в частности, умеет преобразовывать в них формулы Microsoft Equation 3.x, MathType и Microsoft Equation 2007, таблицы, списки, колонтитулы, перекрестные ссылки и пр. При этом в результирующих файлах поддерживаются кодировки ANSI, OEM, MAC, Unicode, что в особенности актуально при работе с кириллицей.

Модуль MathType-to-Equation 2007 также позволяет выполнять преобразование объектов MathType не только в более ранний формат Equation 3 (напомним, прямое преобразование является стандартной функцией MathType), но и в новое внутреннее представление Microsoft Equation 2007.

Кроме того, пакет пополнился бесплатным модулем Image-to Postscript, который выделяет графические элементы из документа Word (рисунки, диаграммы и пр.) и создает из них файлы в формате PostScript, – затем их можно поместить в документы TeX/LaTeX.

Не отстают и наши отечественные разработчики. Летом этого года компания Chikrii Softlab обновила известный, в свое время новаторский продукт Word2TeX, выпустив его 4-й релиз. Эта надстройка интегрируется в любой Word, начиная с 97, и преобразует формулы Equation Editor и MathType (поддерживаются все версии) в LaTeX или TeX. К несомненным ее достоинствам относится корректная работа с кириллицей, в том числе с украинским языком, для чего при конвертации используется таблица Unicode с возможностью ручной настройки. Программа преобразует не только сами формулы, но и ссылки на них, сохраняя цветовые параметры, форматирование текста, стили абзацев, колонки, рисунки (они трансформируются в формат EPS или EPDF), таблицы (в том числе и вложенные), списки, предметные указатели, сноски, гиперссылки и пр.

Помимо поддержки Office 2007 (что сложно выявить визуально, поскольку основные настройки все равно выполняются в диалоговом окне программы, а лента применяется исключительно для запуска импорта-экспорта) в новой версии существенно расширен набор параметров, позволяющих описать особенности форматирования выходящего документа. Так, добавлены поддержка автоматического преобразования ссылок на уравнения и рисунки, функция масштабирования таблиц, возможность трансформации примечаний Word в сноски TeX. Кроме того, программа переводит стили заголовков Word в соответствующие конструкции LaTeX, корректно обрабатывает библиографии, автоматически собираемые указатели и оглавление.

Word, TeX и компания
Кроме своей основной работы Word2TeX уделяет большое внимание внешнему виду результирующего документа

При подготовке документов для Web обычно используется формат pdfTeX, для чего с помощью окна настроек Word2TeX в преамбулу помещаются специфические команды. Функция конвертирования рисунков позволяет управлять растеризацией, способом преобразования векторной графики и задавать специфические параметры расположения изображения на странице.

К сожалению, компания Chikrii Softlab давно не обновляла программу для обратной конвертации и какой-либо официальной информации о будущем развитии данного проекта получить не удалось.