В Стенфордском университете обнаружили изъяны в captcha, основанных на распознавании речи

24 май, 2011 - 11:25

Исследователи лаборатории безопасности Стенфордского университета (Stanford Security Laboratory) создали компьютерную программу, которая распознает аудио captcha, используемые для подтверждения регистрации на многих веб-сайтах – это открывает возможности для выполнения автоматических вторжений на веб-ресурсы.

Как правило, тест captcha, используемый чтобы определить, кем является пользователь системы, человеком или компьютером, содержит деформированный набор символов – задачу его распознавания с легкостью может решить человек, но непросто решить компьютеру. Нередко (в качестве альтернативы для людей с нарушениями зрения) используются captcha, основанные на распознавании речи – пользователю предлагается распознать аудиозапись на фоне шума.

Профессор компьютерных наук Джон Митчелл (John Mitchell) и научный сотрудник Эли Бурштейн (Elie Bursztein) предложили программу Decaptcha, которая может корректно распознавать аудиозапись на фоне шума, таким образом вполне справляется с распознаванием аудио captcha, используемыми Digg, eBay, Microsoft, Yahoo и reCAPTCHA.

Например, аудио captcha Microsoft программа распознает корректно в 50% случаев, наиболее сложными для ПО оказались коды reCAPTCHA, где успехом завершается всего 1% попыток. Но даже такая небольшая доля успешно распознанных captcha может доставить массу неприятностей самым популярным веб-узлам, например YouTube и Facebook, на которые ежедневно заходит миллионы людей.

Принцип работы Decaptcha следующий: сначала из записи удаляется шумовой фон, а затем производится распознавание методом сравнения с имеющимися образцами для каждого символа (буквы или цифры, именно из них составляется captcha). Наиболее точно программа справляется с задачей распознавания, когда в фоне просто шум или эхо-помехи, а когда в фоне музыка или семантический шум (например говорящей толпы) доля успешно распознанных captcha падает до 1%.

В проекте принимали участие специалисты университета Тулейна (Луизиана, США), Французского национального института информатики и автоматизации (INRIA). Исследования проводились при финансовой поддержке Национального научного фонда США, Управления научно-исследовательских работ ВВС США и Управления исследований ВМС США. Результаты работы были представлены на симпозиуме по безопасности, прошедшем в Окленде (Калифорния, США).