Универсальный PDF-инструментарий от ABBYY

21 сентябрь, 2006 - 15:20Елена Дериева

Около двух лет назад компания ABBYY выделила в отдельный пакет средства работы с PDF, предоставляемые в комплекте FineReader 7, – так появился первый релиз PDF Transformer. Конечно, сложно ожидать, что сторонний продукт сможет потеснить Adobe Acrobat, однако его создатели действительно серьезно потрудились над новой версией.

Универсальный PDF-инструментарий от ABBYY

Задача преобразования PDF-файлов в удобный для редактирования вид далеко не нова, для ее решения предлагаются разнообразные утилиты, позволяющие нивелировать отдельные проблемы, связанные с особенностями обработки шрифтов, редактированием, созданием документов и индексированием информации в них. Причину их появления при существующем «комбайне» Adobe Acrobat объяснить довольно просто – цена оригинального комплекта инструментов весьма высока. Впрочем, даже первая версия PDF Transformer выделялась из общего ряда как минимум умением корректно работать с кириллицей, а ее возможность распознавать графические страницы попросту уникальна (за что спасибо FineReader). Тем не менее это был, по большому счету, нишевый продукт, рассчитанный на тех, кому приходится постоянно работать с информацией в PDF-файлах. Новая же версия отличается от своей предшественницы как небо и земля.

Как и прежде, PDF Transformer 2.0 умеет преобразовывать PDF-файлы в привычные форматы – Microsoft Word и Excel, HTML и TXT, сохраняя (при необходимости) оформление исходного документа, в том числе форматирование текста, структуру таблиц, взаимное расположение на странице отдельных элементов (абзацев, картинок, колонок). Любые гиперссылки (как внутренние, так и внешние) выявляются автоматически и воспроизводятся в результирующих файлах. Поддерживаются 37 языков, в числе которых русский и украинский, причем обрабатываемый документ может содержать любые их комбинации (хотя для хорошего результата их не должно быть больше трех), не возникает проблем и с нестандартными кодировками, поскольку программа самостоятельно решает (и не только в подобных ситуациях), что использовать – информацию из текстового слоя либо результат собственно распознавания.

Универсальный PDF-инструментарий от ABBYY
Богатству настроек PDF-XChange позавидует любой настоящий принтер

PDF Transformer довольно удачно конвертирует все типы PDF-файлов, в том числе и страницы со сложным макетом. Однако у прошлой версии был ряд недостатков, в частности, мы сетовали на невозможность сохранения в исходном виде изображений, содержащих текст. В нынешнем релизе данная проблема решена самым замечательным образом. Если PDF Transformer 1.0 представлял собой, по сути, простенький мастер, выполняющий преобразование в автоматическом режиме на основе немногочисленных заданных параметров, то теперь в главном окне PDF Transformer 2.0 осуществляется предварительная разметка документа, которая при необходимости может быть скорректирована вручную. Так, допускается задавать область и порядок распознавания, выделять картинки, таблицы, текстовые блоки и т. д. – это в особенности актуально, например, когда текст обтекает рисунок сложной формы или размещен в нескольких замысловато расположенных фреймах. При этом можно явно указать ориентацию текста или просто отказаться от обработки отдельных частей документа – последнее особенно удобно, если нужно лишь выделить текст (при этом, кстати, вы можете вовсе отказаться от сохранения исходного макета). Впрочем, вмешательство оператора требуется далеко не всегда, поскольку в большинстве случаев программа довольно хорошо справляется со своей задачей и даже преобразует некоторые совершенно неординарные элементы, например рисованные (т. е. графически оформленные) таблицы в обыкновенные.

Естественно, все это функциональное богатство обеспечивается технологиями FineReader, причем в нынешний PDF Transformer 2.0 включен движок восьмого релиза флагманского продукта ABBYY (в предыдущем использовался из седьмого). Исходя из этого можно заключить, что новая версия программы будет лучше справляться с «любительскими» документами, созданными из графических материалов невысокого качества. Аналогично применяется новейшая библиотека Adobe PDF, что обеспечивает поддержку последних модификаций формата, а также корректную (т. е. не нарушающую авторских прав) обработку защищенных файлов. Несомненно, эти факты сказались на общем качестве работы программы, хотя основные улучшения, по нашему мнению, связаны именно с режимом предварительной разметки.

На этом, впрочем, сюрпризы не заканчиваются. Абсолютно новой возможностью PDF Transformer 2.0 является создание PDF-файлов практически из любого приложения. Данная функция, безусловно, не уникальна, она реализована во многих отдельных продуктах и даже встроена в некоторые альтернативные офисные пакеты. Однако ее нет в Microsoft Office и, видимо, не будет в следующей версии, так что усилия ABBYY явно не пропадут зря, тем более что ее решение имеет ряд преимуществ, в частности широкую языковую поддержку.

Универсальный PDF-инструментарий от ABBYY
Главное достоинство новой версии – возможность управления предварительной разметкой документа

Итак, PDF Transformer 2.0 встраивает специальные дополнения в основные приложения Microsoft Office и выполняет преобразование в разных режимах, с сохранением оформления и без него, подбирая размер создаваемых PDF-документов в зависимости от их назначения. Также предусмотрена возможность защиты файла паролем на открытие, на редактирование отдельных элементов и печать. Кроме того, PDF Transformer 2.0 позволяет заполнять дополнительные свойства документа, которые в дальнейшем будут использоваться для индексации и поиска файлов. В других приложениях достаточно выполнить печать на виртуальный принтер PDF-XChange for ABBYY PDF Transformer (модуль лицензирован у Tracker Software), который также допускает подробную настройку.

Таким образом, ABBYY PDF Transformer фактически из нишевой утилиты превратился в достаточно мощный и универсальный инструмент для работы с PDF-файлами. Конечно, нужно понимать, что в отличие от Adobe Acrobat он не позволяет редактировать информацию непосредственно в «родном» формате, но для документов с относительно несложной структурой двойное преобразование дает возможность практически сохранить исходный макет.