`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

IRISPen: маркер-переводчик

Статья опубликована в №46 (565) от 5 декабря

0 
 

Сканеры – нечастые гости на страницах нашего еженедельника, но в этом материале речь пойдет не о каком-то новом устройстве, а об интересном (хотя уже и не оригинальном) комплексном решении, характеризуемом компактным дизайном, мощной программной поддержкой, гибкостью настроек. В конце концов, кому не хотелось бы, например, иметь возможность автоматически считывать данные с визиток практически в полевых условиях?

Хотя «электронный документооборот» давно уже стал расхожей темой, наша деятельность по-прежнему во многом полагается на бумажные (твердые) копии. И каковы бы ни были причины этого явления, нельзя игнорировать тот факт, что популярность операций сканирования и распознавания как минимум не снижается. Традиционные планшетные сканеры превратились, пожалуй, в наиболее доступный вид компьютерной периферии, а о демонстрируемых ими характеристиках еще несколько лет назад можно было только мечтать. Тем не менее они удобны отнюдь не во всех ситуациях – например, с помощью этих устройств проблематично качественно отсканировать толстую книгу, не повредив ее, и уж тем более их не захватишь с собой в библиотеку. Причем далеко не всегда стоит задача полного воссоздания оригинала – нередко достаточно ограничиться лишь какими-то фрагментами информации (цитатами из книги, реквизитами с визиток или из буклетов, данными по отдельным товарам из прайс-листов и т. д.) – и в таких случаях особенно удобны компактные специализированные устройства.

IRISPen маркер-переводчик
По размеру, форме и способу работы IRISPen похож на обычный маркер

С одним из их типов мы уже знакомились на примере «ручки»-сканера C-Pen , а сегодня представляем новые для нашего рынка устройства семейства IRISPen компании I.R.I.S., которая, кстати, является и производителем используемой в них OCR-системы (см. врезку). Линейку составляют модели с маркировкой Express, распознающие только печатный текст, и Executive, умеющие также работать со штрихкодами и некоторыми рукописными символами. Кроме того, комплектация Executive Asian адаптирована к нескольким вариантам корейского, китайского и японского языков. Присутствие в названиях базовых моделей слова Translator означает возможность перевода сканируемого текста на лету – данная функция работает исключительно в Windows, тогда как все остальные доступны и в Mac OS, начиная с версии 10.3.

OCR-система Readiris Pro 11

Рассказывая о IRISPen, нельзя обойти вниманием применяемую в нем систему распознавания Readiris. Текущая версия локализована на 21 и умеет работать с текстом на 127 языках, включая иврит, отдельные диалекты китайского и корейского, а в специальной версии Corporate – арабский и фарси, штрихкоды, в том числе и двухмерные. Readiris Pro 11 поддерживает наиболее часто используемые форматы изображений, среди которых JPEG, JPEG 2000, распознает многостраничные документы в форматах DjVu и PDF, а также умеет выполнять пакетную обработку файлов, находящихся в одной папке.

Как и другие современные OCR-системы, Readiris определяет и сохраняет форматирование документа, структуру таблиц. Результаты сохраняются не только в традиционных документах Microsoft Office, но также OpenOffice и StarOffice, поддерживаются даже современные XML-форматы. Кроме того, ПО умеет распознавать визитные карточки, преобразуя их, например, непосредственно в файлы vCard либо в структурированный вид для последующей обработки.

Согласно спецификации Readiris Pro 11 распознает оригиналы с разрешением от 150 до 800 dpi, хотя оптимальным считается 300–400 dpi. Тем не менее программа располагает специальными алгоритмами для обработки изображений с малым разрешением, например цифровыми фото или факсами и в большинстве случаев справляется с ними довольно уверенно. Правда, еще при открытии подобного файла необходимо указать точный тип оригинала и (чаще всего) задать опцию его обработки как оригинала с разрешением 300 dpi. Выбрать данный режим уже в процессе работы не удастся, а программа будет настойчиво требовать пересканировать документ с большим разрешением. Впрочем, все подобные нюансы и рекомендации вполне прозрачно описаны в справочной системе.

Программа позволяет размечать документы перед окончательной обработкой, выделяя текстовые фрагменты как автоматически, так и вручную. В случае документов со сложной структурой ручная разметка несколько повышает качество результата за счет уменьшения количества мусора – распознанных элементов, помещенных в текст картинок и диаграмм.

Readiris Pro 11 имеет и ряд дополнительных функций, которыми могут похвастаться далеко не все современные OCR. К таковым можно отнести работу с отдельными рукописными символами (система располагает более 1 млн образцов для различных алфавитов) и даже со слитным рукописным текстом, хотя и без гарантированного результата.

В духе времени система обеспечивает двустороннюю работу с PDF-документами, включая их преобразование в поддерживаемые редактируемые форматы, а также сохранение в них распознанной информации в различных комбинациях графики и текста. Имеется и ряд специальных функций, вроде оптимизации размеров файлов.

Во всех комплектациях используется одно и то же аппаратное обеспечение. Сканер подключается через USB-порт и не требует отдельных элементов питания. Он имеет форму маркера (а не ручки, вопреки названию), что представляется естественным выбором, поскольку им также нужно вести вдоль строк текста. Возле сканирующей головки находится специальное (утапливаемое) колесико, позволяющее легко сохранять заданное направление движения IRISPen. Тем не менее устройство следует держать относительно правильно (под небольшим углом к вертикали), перевод в рабочий режим производится автоматически и сопровождается зеленой подсветкой. В начале работы также необходимо провести процедуру калибровки, запускаемую из ПО. На корпусе IRISPen расположены две кнопки, функции которых можно настраивать по собственному усмотрению – для ввода отсканированной части текста, его перевода и т. д. Продуманная эргономика позволяет с удобством работать как с документами на отдельных листах, так и с подшивками и даже толстыми фолиантами, производя сканирование практически вплотную к корешку. Не забыли разработчики IRISPen и о «леворуких» пользователях – опции дают возможность задать режим сканирования справа налево.

Сопровождающее ПО рекомендуется устанавливать до подключения устройства к компьютеру, чтобы в систему загодя скопировались необходимые драйверы. В зависимости от комплектации также будут инсталлированы соответствующие OCR-модули и программа перевода @Promt, которая на поверку оказывается специальной версией PromtX 6.5. Для последней позволяется выбрать лишь одну языковую пару (из доступных двусторонних английский – французский/испанский/русский/немецкий, французский – испанский, а также односторонней английский – португальский), причем сделать это нужно в самом начале, что представляется довольно жестким ограничением. Возможности и качество перевода Promt обсуждать не имеет смысла ввиду того, что мы не раз обращались к этой теме прежде. Тем не менее даже не самые совершенные с грамматической точки зрения результаты окажутся полезными именно в силу того, что IRISPen предназначен для работы с цитатами, а не с большими массивами текста.

Собственно OCR-модуль IRISPen поддерживает распознавание символов 55 языков, а также имеет предустановки для работы с двуязычными текстами, в том числе русско-английским и украинско-английским. Интерфейс программы доступен на семи языках, но русской и украинской локализаций пока нет.

Согласно спецификации IRISPen способен обрабатывать до 8 см графической информации в секунду, хотя скорость программной части гораздо выше – до 1 тыс. символов за то же время. Конструкция сканирующей головки позволяет распознавать любой шрифт размером от 6 до 22 пт, а оптическое разрешение 300 dpi (экстраполируемое до 600 dpi при активизации опции, отвечающей за обработку мелкого текста) достаточно практически для любых ситуаций. К тому же сканер IRISPen хоть и монохромный, но распознает 256 оттенков серого, за счет чего довольно уверенно обрабатывает и цветной текст. Однако в случае неконтрастных оригиналов, инверсного и мелкого шрифта необходимо использовать соответствующие настройки – текст будет распознан в любом случае, хотя, возможно, и с несколько худшим результатом. IRISPen успешно справляется и с неровными строками – это как раз тот случай, когда благодаря способу сканирования частично нивелируются дефекты оригинала или недостаток «интеллекта» у ПО.

При работе с мелким текстом можно задействовать многострочный режим распознавания, однако следует отметить, что уже при работе с кеглем 10 пт при одинарном интерлиньяже он оказывается практически бесполезным. Зато IRISPen прекрасно справляется с ситуациями, когда в одной строке используются символы различных гарнитур (полужирный, курсив и т. д.). Небольшие проблемы возникают с отдельными символами кириллицы, изображенными курсивом (например, «д»), – это не критично на этапе OCR, но оказывает заметное влияние на качество перевода.

IRISPen умеет обрабатывать не только печатные оригиналы. Корректно распознаются отдельные рукописные цифры, что может пригодиться, например, при вводе данных с различных форм. Модели Executive успешно считывают одномерные штрихкоды. При этом нужно обязательно захватывать часть пространства как до, так и после изображения, а для повышения качества – настроить прибор на один из 12 типов штрихкода. IRISPen хорошо работает и с таблицами: OCR-программа умеет корректно считывать их содержимое (автоматически определяя символ-разделитель, хотя его можно задать вручную в окне настройки) и помещать распознанные элементы непосредственно в ячейки Excel.

Все распознанные объекты по желанию пользователя могут помещаться в буфер обмена либо непосредственно в выбранное приложение, а также в окно PromtX с мгновенным переводом и даже возможностью озвучивания, правда, на русском и украинском – с заметным акцентом.

Совершенно естественно, что наряду с набором достоинств любое решение имеет и слабые стороны. Что касается IRISPen, то нужно признать, что в большинстве случаев текст будет вводиться только построчно, а это совершенно неприемлемо для существенных объемов сканирования. Следует также понимать, что IRISPen представляет собой цельное решение, и, например, в OCR-модуль не удастся направить готовое изображение. А вот модуль перевода @Promt будет работать и автономно. Имеется и ряд мелких технических недочетов, связанных в первую очередь с качеством распознавания кириллицы, и, как правило, проявляющихся в сложных ситуациях – например при работе в режиме «левши». Но не стоит забывать, что речь идет о достаточно нишевом продукте, а в этом случае все минусы с лихвой компенсируются компактностью, простотой транспортировки и возможностью использования в самых разных условиях – хоть на ходу.

Продукт предоставлен компанией «Софтпром»,
тел.: (044) 242-5300,ориентировочная цена – 1401 грн.

Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT