Военные разработали фреймворк для эффективной тренировки группового ИИ

9 июнь, 2021 - 10:05

В лаборатории ARL (Army Research Laboratory) разработали математическую основу, для эффективной тренировки сотрудничающих многоагентных систем, спрос на которые становится всё более преобладающим в коммерческой индустрии и в армии.

Эта работа, представленная обзорной статьёй в цифровой библиотеке SPIE, будет стимулировать исследования новых подходов к обучению с подкреплением для разработки сотрудничающих систем, таких как команды роботов, взаимодействующие с солдатами в тактической обстановке.

Одновременно тренировать много агентов сложно, и чем больше агентов, тем труднее координировать этот процесс. Исследователи предположили, что нужным ответом может стать централизация обучения, которая позволит ускорить разработку гибких автономных систем.

«Результатом единообразного централизованного обучения могут стать мультиагентные системы, которые более надежно работают вместе, повышая уровень доверия Солдата к искусственному интеллекту», — сказал доктор Пиюш Шарма (Piyush K. Sharma) из ARL.

Базовая математическая модель предоставит возможность сравнивать различные методы централизованного обучения, оценивать их влияние на скорость тренировки и результирующее коллективное поведение.

В ходе её разработки были изучены новейшие алгоритмы, опубликованные в последние 5-6 лет. Авторы считают, что им удалось выявить слабые места этих методов и наметить направления дальнейших исследований, ведущих в перспективе к совершенствованию тренировочного процесса.

Централизованные методы тоже имеют свои ограничения, поэтому в дальнейшем команда проведёт эмпирический анализ и существующих методов децентрализованного обучения. Они также планируют перейти к моделированию и симуляциям многоагентного обучения с подкреплением, чтобы проверить и развить далее имеющиеся теории обучения, поведения и координирования агентов.