+33 голоса |
Корпорация IBM и Евросоюз объявили о расширении сотрудничества – более двух десятков исследовательских институтов, университетов и компаний Европы объединят усилия для разработки технологии, которая бы позволила провести крупномасштабную оцифровку редких и исторически важных текстов.
В отличие от прошлых подобных проектов, результаты которых были статичными, инициатива IMPACT (IMProving ACcess to Text) подразумевает создание онлайн-библиотек, что обеспечит простой доступ к данным, а также даст возможность их редактирования и поиска нужных документов.
В основе IMPACT лежит ПО на базе веб-технологии адаптивного оптического распознавания символов (OCR) и метод «общественного компьютинга» (crowd computing), который подразумевает вовлечение в работу большого количества сторонних специалистов и энтузиастов. Вместе эти технологии позволят уменьшить количество ошибок при переводе в цифровой вид старых шрифтов на 35% и снизить вероятность подмены нужных символов неправильными на 75%. В обычных условиях нестандартная форма старых шрифтов, поблекшие чернила и ветхость страниц способны увеличить вероятность ошибок при работе алгоритма оптического распознавания символов до 50%, что делает неизбежной последующую тщательную правку с затратой огромных человеческих ресурсов.
Ready, set, buy! Посібник для початківців - як придбати Copilot для Microsoft 365
+33 голоса |