Открытие вместо распознавания — новый подход к анализу больших данных

21 апрель, 2017 - 16:55

Сегодняшние компьютеры выявляют закономерности на основе имеющихся шаблонов. Так, например, работают системы распознавания речи: они сравнивают голос с каталогом звуков. Подобные алгоритмы могут приносить большую пользу, но они неспособны обнаруживать ничего действительно нового — того, что отсутствует в их шаблонах.

«Для интерпретации очень больших данных и симуляций в масштабах планеты нам требуется новый тип машинного обучения», — утверждает Джим Кратчфилд (Jim Crutchfield) из Калифорнийского университета (UC Davis). Он занимается разработкой систем, позволяющих суперкомпьютером выявлять крупномасштабные атмосферные структуры, такие как ураганы и воздушные течения, влияющие на погоду.

Климатическая обстановка постепенно изменяется и такие системы должны уметь находить закономерности не только в пространстве, но и во времени. Люди и животные распознают динамические изменения очень быстро, но для машин это представляет большую сложность.

Команда Кратчфилда исследует новый подход к машинному обучению, основанный на открытии закономерностей (pattern discovery). Ученые создают алгоритмы, позволяющие идентифицировать ранее неизвестные структуры в данных, включая такие, сложность которых превосходит человеческое понимание.

«Обычно, для интерпретации данных используются известные модели. Утверждение, что модель можно извлечь непосредственно из данных, звучит весьма радикально», — отметил он. Кратчфилд надеется, что область применения этой новой парадигмы не будет ограничиваться моделирование климата, и она станет стандартными методом анализа очень больших массивов данных.