`

СПЕЦИАЛЬНЫЕ
ПАРТНЕРЫ
ПРОЕКТА

Архив номеров

Как изменилось финансирование ИТ-направления в вашей организации?

Best CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

PenReader 8.0 – полноценный рукописный ввод на русском языке

Статья опубликована в №33 (650) от 2 сентября

+44
голоса

Хотя современный человек все меньше обращается с пером и чернилами, рукописный ввод остается, без сомнения, самым быстрым и удобным способом создания кратких заметок. Еще совсем недавно – исключительно в блокноте, сейчас – на экране планшетного компьютера или коммуникатора. Задача лишь в том, чтобы найти ПО, хорошо понимающее не только ваш родной язык, но и почерк.

Несмотря на активный рост продаж коммуникаторов и все более широкое их применение в корпоративном секторе, ввод текста на них по-прежнему не слишком удобен – в основном из-за малых размеров кнопок как на виртуальной, так и (чаще всего) на физической клавиатуре. С другой стороны, наличие сенсорного экрана порождает желание использовать его в полной мере, скажем, задействовать всю площадь, а не только сегменты, оставшиеся от экранной клавиатуры.

PenReader 8.0 – полноценный рукописный ввод на русском языке
PenReader неплохо справляется с любым почерком

К сожалению, рукописный ввод пока находится примерно на том же уровне, что и голосовой. То есть кажется: еще немного, и наконец-то он станет действительно удобным и качественным (а не приемлемым с многочисленными оговорками). Однако если до сих пор этого не произошло даже на планшетных компьютерах, то какие основания для надежд в случае КПК или коммуникаторов? Тем не менее карманные устройства развиваются завидными темпами и сегодня, пожалуй, уже сравнимы с настольными компьютерами десятилетней давности. Лишь бы разработчики не опускали рук.

Как обычно, лучше всего дела обстоят с английским языком. Использование лишь основных символов латинского алфавита, отсутствие литер с вычурным начертанием, сравнительная простота морфологии – все это упрощает алгоритмы. Соответственно и нет недостатка в программах распознавания рукописного ввода – как слитного, так и посимвольного. Самой известной, пожалуй, является Microsoft Transcriber, традиционно стандартно предустанавливаемая в Windows Mobile. Но, к сожалению, ее развитие приостановилось некоторое время назад, и если с английским она справляется действительно неплохо, то с немецким или французским – ощутимо хуже, в чем честно признаются даже сами разработчики.

Впрочем, то же самое можно сказать и о сторонних решениях (особенно когда речь идет о слитном письме), а виной тому, не в последнюю очередь, диакритические знаки. Это, кстати, свидетельствует о том, что программисты больше полагались на помощь словаря, чем на алгоритмы собственно распознавания. В свете вышесказанного несложно понять, почему языки, основанные на кириллице (где достаточно часто встречается сходное начертание как отдельных символов, так и их сочетаний), и подавно не вызывают энтузиазма у западных разработчиков. Поэтому данную нишу традиционно пытаются осваивать российские производители ПО, которых, однако, несложно перечесть по пальцам.

К лидерам в этой области можно отнести компанию Paragon Software, в течение нескольких последних лет предлагающую различное ПО для мобильных компьютеров всех формфакторов, в том числе и средства распознавания рукописного ввода под маркой PenReader (ko-online.com.ua/20738). А совсем недавно была представлена новая версия PenReader 8 для Windows Mobile (поддерживаются все актуальные релизы ОС, начиная с Windows Mobile 2003, а также QVGA- и VGA-экраны), в которой впервые реализовано распознавание слитного письма на русском языке. Справедливости ради отметим, что первопроходцем здесь является другая российская компания, Quarta Technologies, еще несколько лет назад представившая Pocket PC Recognizer Pack. Однако это решение основано на технологиях Microsoft и EverNote, в частности, оно встраивается в Microsoft Transcriber и, похоже, сегодня «заморожено» вместе с этой программой.

PenReader 8.0 – полноценный рукописный ввод на русском языке
Если возникли трудности с определенным символом, обратитесь к прописям

В PenReader 8 для Windows Mobile используется новый механизм идентификации букв, цифр, стандартных символов, а также ряда макросов, дублирующих основные функции клавиатуры (переключение регистра, удаление символа, смена режима и пр.). Для корректного распознавания теперь не нужно стараться аккуратно придерживаться горизонтальных строк – программа на приличном уровне обрабатывает текст, написанный по диагонали, более того, даже вертикально развернутую строку она попытается идентифицировать (правда, с ощутимым снижением качества).

Конечно, нельзя сказать, что новая версия совершенно не чувствительна к почерку. Хотя она и не требует чудес каллиграфии, все же писать стоит достаточно аккуратно. Программа в значительной степени полагается на графический анализ и сравнивает вводимые росчерки с представленными в системе образцами (по утверждению разработчиков, для их создания использовано свыше 500 тыс. примеров почерка). С помощью настроек можно выбрать предпочтительные способы начертания или наоборот, исключить отдельные из них, но вот если ваша манера письма определенного символа не входит в имеющийся перечень – подстраиваться придется именно вам. Похоже, это объективное ограничение технологии, поскольку ни одна система распознавания слитного письма не предполагает корректировки базы росчерков, хотя это не редкость для продуктов, работающих посимвольно.

Тем не менее PenReader 8 все же пытается подстраиваться под конкретного пользователя, правда, за счет иных инструментов. Так, наряду с графическим в продукте применяется и орфографический анализ на основе словаря (который к тому же можно пополнять), а также система ранжирования. Если программе не удается уверенно распознать набор символов, она предложит несколько вероятных вариантов и запомнит выбранный, таким образом постепенно адаптируясь к почерку. Кстати, помимо отдельных символов и слов, в словаре имеются целые словосочетания, а частоту обращения за подсказкой можно настроить.

PenReader 8.0 – полноценный рукописный ввод на русском языке
Активное привлечение словаря на первом этапе может раздражать, но это – залог беспроблемного будущего

Следует, впрочем, иметь в виду, что использование словаря может оказаться как благом, так и недостатком – с одной стороны, оно вроде бы повышает качество, но с другой, – может заметно сказаться на скорости работы программы, что особенно досаждает, если распознавание выполнено неточно или вообще неверно. Подобный эффект, кстати, наблюдается у упоминавшегося выше пакета Pocket PC Recognizer Pack, оперирующего боóльшим, чем у PenReader 8, словарем (это понятно даже косвенно, по размеру дистрибутива и занимаемой оперативной памяти), но работающего заметно медленнее – вычислительные способности КПК и коммуникаторов все-таки ограничены, хотя и растут день ото дня.

Неудивительно, что иногда проверка результатов распознавания по словарю только мешает корректному вводу специальных терминов или, что даже чаще, имен собственных. Во избежание подобных неприятностей в новой версии предусмотрен специальный режим, который выбирается оперативно, без обращения к окну настроек: он отключает словарь и включает посимвольный ввод. Новая версия PenReader имеет и ряд более мелких дополнений – поддержку переноса слов, настройку цвета и толщины линии, задержки распознавания, добавления пробелов и пр.

Как уже упоминалось, работа с диакритическими знаками остается, пожалуй, характерным «узким местом» всех без исключения систем распознавания рукописного текста – программа, тем более подразумевающая ввод по всей поверхности экрана, не всегда в состоянии определить, является ли тот или иной росчерк отдельной буквой или частью другой. Тем не менее PenReader 8 с этой задачей преимущественно справляется, хотя и несколько хуже, чем с аналогичными символами без «добавок». Отчасти этот недостаток компенсируется словарем, но и пользователь может внести посильный вклад, начав применять почерпнутые в разделе настроек «Прописи» способы ввода. Например, достаточно взять за правило в букве «ё» ставить точки справа налево (напомним, добавить собственный способ нельзя) – и точность результата вырастет на глазах.

В ближайших планах компании Paragon – выпуск нескольких европейских локализаций и реализация распознавания слитного письма для планшетных компьютеров. А вот украиноязычным пользователям КПК и коммуникаторов, по-видимому, в скором времени не удастся применить навыки, приобретенные на уроках чистописания. Несмотря на то что украинский посимвольный ввод появился еще в 2005 г. в PenReader для Tablet PC, поддержка этого языка в ближайших версиях не планируется.

+44
голоса

Напечатать Отправить другу

Читайте также

 
 
IDC
Реклама

  •  Home  •  Рынок  •  ИТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Сети  •  Безопасность  •  Наука  •  IoT