Компьютеры могут учиться по-человечески

11 декабрь, 2015 - 14:31

Компьютер научили учиться по-человечески

Людям для обучения пользованию новой стиральной машиной, новым танцевальным движениям или для запоминания буквы незнакомого алфавита, обычно, требуется всего несколько упражнений. Современным машинам, вооруженным интеллектуальными алгоритмами распознавания, чтобы достичь сопоставимой точности работы требуются сотни и тысячи примеров.

«Крайне сложно построить машины, способные обходиться при изучении новых концепций столь же малым количеством данных, как и люди, — отметил Руслан Салахутдинов, адъюнкт-профессор компьютерных наук Университета Торонто (Канада). — Воспроизведение этих способностей — перспективная область исследований на стыке машинного обучения, статистики, компьютерного зрения и когнитивной науки».

В статье, опубликованной им в журнале Science почти десять лет назад, на заре нынешнего увлечения «глубокими нейросетями», описывался алгоритм, который обучался узнавать цифры от 0 до 9 в рукописной форме на 6 тыс. примерах для каждой из них. На этой неделе, в Science вышла новая публикация, где исследуются способы сокращения процесса обучения и наделения компьютера человекоподобными способностями генерирования новых примеров конкретной концепции или создания полностью новых концепций.

Компьютер научили учиться по-человечески

Для этого была разработана новая методология, BPL (Bayesian Program Learning), согласно которой концепции рассматривались как простые компьютерные программы. Так, буква «А» представлялась компьютерным кодом, генерирующим примеры этой буквы. Такие мини-программы конструировались самим алгоритмом и работали вероятностным образом — при каждом выполнении давали разный результат. Это позволяло машине понять, каким образом могут изменяться примеры одной и той же концепции, например, одна и та же буква, написанная разными людьми.

В отличие от стандартных алгоритмов распознавания образов, оперирующих конфигурацией пикселей или наборами отличительных признаков, BPL сводит процесс обучения к «построению моделей» или «объяснению» данных, предоставляемых алгоритмом. Помимо этого, используется опыт освоения предшествующих концепций для ускорения обучения новым — система «учится учиться».

Авторы опробовали свою модель на более чем 1600 типах рукописных букв 50 систем письма, включая санскрит, гуджарати, глаголитик и даже придуманные буквы из телесериала Футурама. Перед людьми и компьютерами ставилась дополнительная задача воспроизвести рукописные символы по единственному образцу и создать новые буквы в стиле продемонстрированных.

Для сравнения результатов, полученных от машин и от людей, авторы использовали «визуальные тесты Тьюринга». Как оказалось, менее четверти арбитров-людей могли различать творчество человека и компьютера иначе, чем случайным образом.

«Мы все ещё далеки от создания машин столь же смышлёных как человеческий ребёнок, но, по крайней мере, имеем такую, которая трудноотличима от людей по способам усвоения и использования большого класса концепций реального мира», — заявил ещё один соавтор работы, профессор Массачусетского технологического института Джошуа Тененбаум (Joshua Tenenbaum).