Алгоритмы ИИ тренируют не искать лёгких путей

3 ноября 2021 г., 13:15

Алгоритмы ИИ тренируют не искать лёгких путей

Модель искусственного интеллекта тренируясь распознавать коров на снимках, вместо того, чтобы анализировать форму изображённых объектов, может ограничится наличием зелёной травы. Такое явление называется выбором короткого пути (shortcut) в машинном обучении и, очевидно, может привести к нежелательным результатам.

В новой статье, выложенной на сервер arXiv.org, исследователи из Массачусетского технологического института (MIT) предложили вариант решения этой проблемы. Он заключается в том, что ИИ-модель принудительно заставляют использовать больше данных в ходе принятия решений, удаляя самые простые характеристики.

Исследование MIT было сосредоточено на контрастном обучении, которое является мощной формой машинного обучения без наставника. Для моделей контрастного обучения алгоритм кодировщика тренируют различать пары одинаковых и разнородных входных данных.

Подобные кодировщики, как выяснилось в ходе исследования, также склонны к выбору коротких путей и из всех характеристик анализируемого изображения при принятии решения предпочитают руководствоваться только самыми простыми.

Постепенно усложняя задачу различать похожие и разнородные элементы, учёные обнаружили, что таким способом система вынуждалась изучать более значимую информацию в данных, потому что, без неё не могла решить задачу.

Однако, одно только увеличение сложности приводило к тому, что алгоритм, казалось, забывал о более простых функциях. Чтобы избежать этого, исследователи заставили кодировщик различать пары обоими способами: сначала используя более простые функции, а затем — используя сложные функции, которые он уже научился выделять.

Этот, так называемый, метод неявной модификации признаков, адаптивно изменяет образцы, чтобы удалить более простые функции, которые кодер использует для различения пар. Он не полагается на вмешательство в обучение человека, что важно, потому что наборы данных реального мира могут иметь сотни различных признаков, сложным образом сочетающихся между собой.

Авторы работы планируют продолжить совершенствование своих методов, в том числе применительно к другим типам обучения без наставника.

Презентация этого исследования должна состояться на пятой ежегодной Конференции по нейронным системам обработки информации (NeurIPS 2021), которая стартует в виртуальном режиме 6 декабря.

Стратегія охолодження ЦОД для епохи AI