`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

FineReader 9.0: эволюция OCR‑систем от распознавания символов до целых документов

Статья опубликована в №38 (606) от 9 октября

+11
голос

FineReader 9.0 эволюция OCR‑систем от распознавания символов до целых документов2 октября компания ABBYY Украина представила новую версию OCR-системы FineReader 9.0, в которой впервые реализованы технологии, позволяющие выполнять анализ и распознавание документа как единого целостного объекта, а не набора отдельных страниц.

Для презентации был выбран зал эволюции человека киевского Зоологического музея, что позволило еще раз напомнить присутствующим: несмотря на интенсивное развитие технологий ИИ, на сегодняшний день самой универсальной OCR-системой является человеческий мозг, поэтому задача приближения способов программного распознавания к методам, использующимся идеальной системой, по-прежнему актуальна.

Представляя продукт, старший маркетинг-менеджер по настольным OCR-системам Игорь Федорец подчеркнул, что с выпуском новой версии FineReader перешел на очередную ступень эволюции – от распознавания текста на уровне отдельных слов и страниц к обработке документа в целом. Такой шаг вперед был сделан за счет применения адаптивной технологии распознавания (Adaptive Document Recognition Technology, ADRT).

При чтении текста логическая и физическая структуры документа воспринимаются человеком как единое целое. Однако если воспроизведение физической структуры – элементов форматирования, таблиц, рисунков и т. д. для OCR-систем не представляет сложности, то задача определения на основании этих данных логической структуры (уровня важности информации, назначения элементов форматирования, порядка чтения и восприятия текста) до недавнего времени оставалась проблемой.

ADRT идентифицирует специфические элементы логической структуры документа (заголовки, колонтитулы, сноски, подписи к рисункам, номера страниц) и воспроизводит их в результирующем файле именно как объекты соответствующего типа, а не как обычный текст. Такой подход позволяет наряду с сохранением внешнего вида документа облегчить последующее его редактирование.

Помимо этого, в FineReader 9.0 добавлены типовые сценарии, автоматическое определение языка документа, расширены возможности фоновой работы, усовершенствованы функции распознавания цифровых фотографий, реализована поддержка современных многоядерных процессоров. Также с целью минимизации необходимых действий пользователя в стандартных ситуациях полностью переделан интерфейс программы.

Особое внимание докладчиком было уделено вопросу эффективности новой системы. Согласно данным внутреннего тестирования ABBYY по сравнению с предыдущей версией точность распознавания текстов выросла на 35%, качество сохранения разметки и форматирования – на 32%, при этом время обработки документов сократилось в среднем на 40%.

FineReader 9.0 Professional Edition для индивидуальных пользователей, малых и средних организаций уже выпущена в продажу по цене 648 грн. На начало ноября запланирован выход бесплатного обновления с поддержкой украиноязычного интерфейса.

Версия для корпоративных пользователей Corporate Edition, включающая инструменты совместной работы и возможности распределенного выполнения операций в сети, поступит в продажу в ноябре по цене от 1296 грн. Компания предлагает конкурентные схемы лицензирования с учетом числа рабочих мест.

+11
голос

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT