2 октября компания ABBYY Украина представила новую версию OCR-системы FineReader 9.0, в которой впервые реализованы технологии, позволяющие выполнять анализ и распознавание документа как единого целостного объекта, а не набора отдельных страниц.
Для презентации был выбран зал эволюции человека киевского Зоологического музея, что позволило еще раз напомнить присутствующим: несмотря на интенсивное развитие технологий ИИ, на сегодняшний день самой универсальной OCR-системой является человеческий мозг, поэтому задача приближения способов программного распознавания к методам, использующимся идеальной системой, по-прежнему актуальна.
Представляя продукт, старший маркетинг-менеджер по настольным OCR-системам Игорь Федорец подчеркнул, что с выпуском новой версии FineReader перешел на очередную ступень эволюции – от распознавания текста на уровне отдельных слов и страниц к обработке документа в целом. Такой шаг вперед был сделан за счет применения адаптивной технологии распознавания (Adaptive Document Recognition Technology, ADRT).
При чтении текста логическая и физическая структуры документа воспринимаются человеком как единое целое. Однако если воспроизведение физической структуры – элементов форматирования, таблиц, рисунков и т. д. для OCR-систем не представляет сложности, то задача определения на основании этих данных логической структуры (уровня важности информации, назначения элементов форматирования, порядка чтения и восприятия текста) до недавнего времени оставалась проблемой.
ADRT идентифицирует специфические элементы логической структуры документа (заголовки, колонтитулы, сноски, подписи к рисункам, номера страниц) и воспроизводит их в результирующем файле именно как объекты соответствующего типа, а не как обычный текст. Такой подход позволяет наряду с сохранением внешнего вида документа облегчить последующее его редактирование.
Помимо этого, в FineReader 9.0 добавлены типовые сценарии, автоматическое определение языка документа, расширены возможности фоновой работы, усовершенствованы функции распознавания цифровых фотографий, реализована поддержка современных многоядерных процессоров. Также с целью минимизации необходимых действий пользователя в стандартных ситуациях полностью переделан интерфейс программы.
Особое внимание докладчиком было уделено вопросу эффективности новой системы. Согласно данным внутреннего тестирования ABBYY по сравнению с предыдущей версией точность распознавания текстов выросла на 35%, качество сохранения разметки и форматирования – на 32%, при этом время обработки документов сократилось в среднем на 40%.
FineReader 9.0 Professional Edition для индивидуальных пользователей, малых и средних организаций уже выпущена в продажу по цене 648 грн. На начало ноября запланирован выход бесплатного обновления с поддержкой украиноязычного интерфейса.
Версия для корпоративных пользователей Corporate Edition, включающая инструменты совместной работы и возможности распределенного выполнения операций в сети, поступит в продажу в ноябре по цене от 1296 грн. Компания предлагает конкурентные схемы лицензирования с учетом числа рабочих мест.
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365