ABBYY FineReader 8.0: навстречу цифровому фото

22 сентябрь, 2005 - 23:00Елена Дериева

ABBYY FineReader вряд ли нуждается в особом представлении – это не только один из немногих доступных сегодня OCR-пакетов, но и практически единственный, обеспечивающий действительно качественную поддержку кириллицы. Тем не менее разработчики не почивают на лаврах, а постоянно находят новые способы совершенствования своего продукта.

Традиционно считается, что современные OCR-системы демонстрируют уверенное распознавание при использовании оригиналов с разрешением 300 dpi – большее не требуется, меньшее ставит под сомнение качество результата. Сейчас уже трудно вспомнить, откуда точно взялся такой критерий, но, вероятно, это был некий компромисс: с одной стороны, 300 dpi обеспечивали даже довольно старые сканеры, в том числе и рассчитанные на домашнее применение, с другой – не нужно было разрабатывать слишком уж хитроумные алгоритмы. Так или иначе, все современные OCR-системы уверенно справляются с текстом в таком разрешении, а основная конкуренция развернулась в области вспомогательных функций: распознавание штрихкодов, выделение гиперссылок, поддержки новых форматов, обеспечение полнотекстового поиска и пр.

ABBYY FineReader 8.0 навстречу цифровому фото

Однако сканер – далеко не единственное устройство, предоставляющее текстовую информацию в графическом виде. Скажем, факс – весьма распространенное средство коммуникаций, но качество полученных с его помощью оригиналов оставляет желать лучшего. А в последнее время все больше пользователей хотят осуществлять ввод документов с помощью цифровой фотокамеры. В связи с этим у поставщиков OCR-систем появился новый ориентир – добиться лучшей работы своих продуктов с исходными материалами низкого качества, в частности с невысоким разрешением.

Указанные тенденции сполна проявились в FineReader 8.0. Отныне минимальное разрешение для уверенного распознавания – 200 dpi, новая версия программы обрабатывает такие оригиналы в среднем на 15% лучше, а факсы – на все 30% (эти показатели приводит сама ABBYY). Цифровым фотографиям вообще уделено особое внимание. Качество их распознавания повышено на 40%, причем допускается использование даже 2-мегапиксельных камер. Однако, как несложно подсчитать, снять страницу формата А4 (8,27×11,29 дюймов) с тем самым разрешением в 200 dpi позволяют 4-мегапиксельные аппараты, но и в этом случае результат будет зависеть от множества дополнительных факторов, в связи с чем значительная часть руководства по FineReader 8.0 посвящена именно описанию того, как с помощью фотокамеры подготовить наиболее удачные исходные материалы.

ABBYY FineReader 8.0 навстречу цифровому фото
FineReader 8 очень неплохо справляется с цифровыми фотографиями, причем никакой специальной их подготовки не требуется

Безусловно, съемку документов лучше производить в условиях хорошего, предпочтительно дневного освещения, применяя штатив и настроив баланс белого по цвету бумаги. Однако даже при соблюдении всех этих (и ряда других) условий фотографиям присущ ряд характерных недостатков: дисторсия (искривление изображения на краях кадра), неравномерная освещенность, цифровые шумы (особенно при использовании повышенной светочувствительности) – все это, естественно, приводит к более низкому качеству распознавания. Поэтому в FineReader 8.0 предусмотрен ряд дополнительных функций по улучшению оригиналов: исправление разрешения, выравнивание строк, обрезание изображения (в частности его краев, где концентрируется «мусор»), удаление шумов. Более того, во многих случаях программа сама способна догадаться, что имеет дело именно с фотографиями, и применить некоторые вспомогательные алгоритмы. Впрочем, все это требует дополнительного времени, поэтому при работе с небольшими документами иногда удобнее внести правки вручную.

Мы провели ряд тестов и самолично убедились, что во многих случаях цифровая камера действительно с успехом способна заменить сканер. В частности, при распознавании снимков страниц «Компьютерного Обозрения», выполненного 4-мегапиксельным аппаратом (причем в совершенно «полевых» условиях, т. е. без штатива и специального освещения), программа делала всего три-четыре ошибки, и сосредоточены они были в самых «проблемных» областях – колонтитулах, сносках. В ряде случаев качество даже удавалось повысить благодаря некоторым специальным мерам, например отказу от формата JPEG в пользу TIF/RAW.

ABBYY FineReader 8.0 навстречу цифровому фото
Сценарии помогут пользователю избавиться от рутины

Общее совершенствование алгоритмов распознавания также позволяет иногда существенно экономить время. Так, если оригиналы имеют довольно высокое качество и не содержат сложных элементов, можно воспользоваться новой функцией быстрого распознавания, которая ускоряет обработку в 2–2,5 раза. Во многих случаях, особенно когда речь идет о многостраничных документах, также удобно выполнять распознавание в фоновом режиме.

Если же стандартные инструменты и приемы не дают желаемого качества, весьма кстати придется предлагаемая FineReader процедура распознавания с обучением. Она также актуальна, если в документе используются вычурные шрифты, лигатуры или специфические для какой-либо предметной области символы. В таком случае сначала в специальном режиме производится распознавание нескольких страниц текста, в ходе чего (с участием пользователя) создаются эталоны вызывающих затруднение фрагментов. Затем накопленные таким образом «знания» используются при автоматической обработке остального массива текста, а сохранив комплект эталонов, его можно применять и в будущем.

FineReader традиционно был полиглотом, и сейчас в пакете поддерживается 179 языков, из них 36 снабжены соответствующими словарями. При необходимости теперь можно подключать собственные дополнительные словари, например созданные в Microsoft Word. Более того, FineReader позволяет даже формировать свои «языки», описав их алфавит из набора доступных символов, указав допустимые знаки препинания, специальные обозначения и прочие характеристики.

Для автоматизации процесса обработки больших массивов документов по одной схеме в новой версии FineReader предусмотрено специальное средство – стандартные и пользовательские сценарии. Наряду с обычными этапами обработки (получения и анализа изображения, распознавания текста и проверки результатов) они могут передавать данные во внешнее приложение или папку, сохранять в многостраничном документе, отправлять по электронной почте.

Дополнением к собственно FineReader является утилита Screenshot Reader, предназначенная для копирования любой части экрана и распознавания содержащегося в нем текста. Хотя на первый взгляд она не кажется особенно востребованной, в некоторых случаях ей, несомненно, найдется разумное применение. Скажем, с помощью Screenshot Reader можно легко извлечь текст из flash-презентации или оперативно распознать сообщение об ошибке и отправить его в службу технического сопровождения.

Полученные тексты допускается сохранять в нескольких новых форматах, в частности в LIT, используемом в Microsoft Reader. Внимание к владельцам КПК проявилось и в поддержке специальных тегов в PDF, благодаря которым документы автоматически переформатируются под конкретный размер экрана. Дополнительно создаваемые PDF-файлы можно защищать паролем либо шифровать (одним из трех способов). Специальный новый блок настроек для RTF/DOC/Word XML позволит максимально сохранить исходное оформление, кроме того, появилась возможность заполнения свойств (ключевые слова, автор и пр.) документов распространенных типов, что в дальнейшем поможет более эффективно использовать современные поисковые системы.

Наряду с персональной компания ABBYY предлагает и корпоративную версию FineReader 8. В нее, помимо описанных выше возможностей, включены специальные средства централизованного управления и поддержки сетевых функций. Основной интерес представляет новая утилита Hot Folder & Scheduling, которая автоматически осуществляет мониторинг локальных и удаленных папок и обработку обнаруженных в них документов в соответствии с составленным расписанием. Это не только исключает потребность в отдельном операторе, но и позволяет максимально эффективно задействовать доступные вычислительные ресурсы (скажем, назначив задание на ночное время).