Paragon PenReader 2005: первый шаг к украинизации планшетных ПК

24 май, 2005 - 23:00Елена Дериева

Несмотря на то что пресс-релиз о выпуске новой версии Paragon PenReader был обнародован еще в начале этого года, мы особо не торопились с подробным обзором данного продукта, ожидая выхода в свет его версии, предназначенной для стран СНГ. Ведь именно она предлагает средства распознавания рукописного ввода не только для русского, но также для украинского и белорусского языков.

Paragon PenReader 2005 первый шаг к украинизации планшетных ПК

Хотя планшетные компьютеры все еще не настолько дешевы и доступны, как хотелось бы, популярность их, несомненно, растет – в первую очередь в корпоративном секторе. Естественно, одним из главных факторов их успеха является поддержка рукописного ввода на родном языке – причем не просто возможность сохранять росчерки (хотя она и сама по себе представляет определенную ценность), а именно функция распознавания. К сожалению, наибольшие сложности возникают с близкими нам украинским и русским языками. Хотя сегодня уже имеются все необходимые средства для вполне гладкой русификации Microsoft Windows XP Tablet PC Edition, украинизации вряд ли стоит ожидать ранее 2007 г., когда появится официально обещанная представителями Microsoft украинская версия Longhorn. Однако до сих пор нет информации о том, будут ли в обозримом будущем реализованы модули распознавания кириллических языков. Соответственно, пока надеяться приходится только на сторонних разработчиков. Опять же, наши северо-восточные коллеги находятся в лучшем положении, поскольку они могут выбирать из двух пакетов – Paragon PenReader и Quarta Russian Enhancement Pack. Поддержка же украинского языка впервые реализована в новой версии Paragon PenReader 2005 (а точнее, в специальной редакции для СНГ, где наряду с русским и английским языками присутствуют также украинский и белорусский), с которой мы и познакомимся поближе.

Paragon PenReader 2005 первый шаг к украинизации планшетных ПК
При использовании PenReader можно писать «почти» слитно

Прежде всего хотелось бы отметить, что PenReader 2005 представляет собой эволюционное развитие прежней версии, поэтому вряд ли стоит рассчитывать на существенное улучшение качества распознавания. Выполняется оно по-прежнему посимвольно, но, по мнению разработчиков, данный подход обладает определенными преимуществами перед обработкой слитного письма. Так, PenReader гораздо менее чувствителен к особенностям почерка, поскольку сам процесс распознавания основан на анализе траектории отрисовки каждого символа и сопоставлении ее с несколькими характерными образцами. Благодаря этому посимвольный ввод существенно упрощает задачу для программного обеспечения, особенно если учесть, что для кириллицы вообще характерно наличие символов (и их комбинаций) со сходным начертанием. Именно поэтому при слитном распознавании приходится полагаться на косвенные признаки вроде присутствия полученного слова в эталонном словаре, что в ряде случаев приводит к обратному результату (т. е. изначально почти корректно распознанное слово может быть заменено совершенно другим). Тем не менее в PenReader 2005 также реализована орфографическая проверка для английского и русского языков. Впрочем, эта функция включается и отключается самим пользователем, который на основе собственных впечатлений может оценить, насколько верно воспринимается его почерк.

Paragon PenReader 2005 первый шаг к украинизации планшетных ПК
Прописи позволяют уточнить способ начертания символов и ограничить механизм распознавания лишь наиболее подходящими образцами

В PenReader 2005 имеется еще один способ корректировки работы алгоритмов распознавания – правда, только в версии Professional. В окне ее настроек есть специальная вкладка Прописи, на которой приведены все образцы для каждого из поддерживаемых символов. К сожалению, добавить свои собственные росчерки нельзя, вместо этого предлагается (при необходимости) сужать спектр существующих, чтобы программа более точно определяла некоторые символы. Дополнительно здесь можно ознакомиться с тем, как именно должны выписываться/рисоваться различные символы, такая возможность особенно пригодится при освоении макросов – специальных росчерков, применяемых для выполнения определенных функций. Так, макрос для смены раскладки клавиатуры должен рисоваться исключительно справа налево – чтобы выяснить это, нужно щелкнуть на данном росчерке. Следует также иметь в виду, что чем выше скорость письма, тем больше вероятность ошибочного распознавания. В остальном же рекомендации традиционны для всех посимвольных систем, известных многим по современным КПК.

Если говорить конкретно о распознавании украинского языка, то в целом оно обеспечивается с тем же качеством, что и для русского (за исключением отсутствия для него орфографической проверки), что и неудивительно, учитывая совпадение большего числа букв двух алфавитов. Однако есть и кое-какие нюансы. К примеру, по непонятной причине программа не знакома со звонким «ґ», хотя эта буква благополучно присутствует на виртуальной клавиатуре. Проблемы также возникают с прописными «І» и «Ї» (тогда как со строчными все в порядке) – для них не поддерживается как раз самое типичное начертание (именно то, которому учат в наших школах) – видимо, разработчики пошли по пути наименьшего сопротивления и попросту перенесли в украинский язык образцы для символа «I» из латинского алфавита. Все это, естественно, будет несложно поправить, конечно, при наличии спроса со стороны наших соотечественников. В идеале было бы удобно иметь возможность добавлять собственные росчерки, но, видимо, реализовать ее на пользовательском уровне не позволяет нынешнее состояние технологии.

Также одним из существенных преимуществ новой версии PenReader является интеграция со стандартной панелью ввода операционной системы. Прежде программа работала исключительно в полноэкранном режиме, что наряду с определенными преимуществами имело и ряд недостатков – в частности, в некоторых приложениях распознавание могло включиться в самый неподходящий момент. Теперь этот режим доступен только в профессиональной версии (однако явно его отключить невозможно), и, соответственно, стандартно предполагается применение именно панели ввода – когда она открыта, распознавание осуществляется исключительно в ней, причем допускается использование и рукописной, и посимвольной панелей. Естественно, здесь речь идет о Microsoft Windows XP Tablet PC Edition 2005, апплеты которой особенно удобны, – хотя PenReader 2005 совместим и с предыдущей версией планшетной операционной системы, нет смысла отказываться от дополнительных возможностей, предлагаемых бесплатно. Впрочем, перед нами этот вопрос даже не стоял, поскольку в качестве тестовой платформы мы взяли нашего старого знакомца – MarcoPolo 25T от компании «Версия», благополучно выдержавшего процедуру обновления при подготовке предыдущих публикаций.

Paragon PenReader 2005 первый шаг к украинизации планшетных ПК
Для русского и английского языков доступен орфографический анализ

Помимо уже упоминавшейся СНГ-версии, также имеются русская и интернациональная редакции, поддерживающие, соответственно, русский и английский или около 30 языков, – каждая из них дополнительно доступна в стандартной либо профессиональной поставке. Таким образом Paragon сделала планшетную платформу Microsoft еще на один шаг ближе к тем, кто пользуется кириллицей. Конечно, хотелось бы, чтобы компьютер выполнял распознавание письма с «человеческим» качеством, без проблем разбираясь с любыми каракулями, написанными слитно или раздельно, каллиграфически или вкривь и вкось, однако пока это недостижимо ни для одной из существующих технологий. Более того, для украинского языка других вариантов просто нет, и в этом смысле PenReader 2005 – вне конкуренции.

При подготовке обзора использовался планшетный компьютер MarcoPolo 25T, любезно предоставленный компанией «Версия», www.versiya.com.