0 |
К настоящему времени уже создано немало программ-ботов, способных побеждать профессионалов-людей в различных играх, требующих командной работы многих игроков. Однако, в таких играх боту сразу была доступна информация об участниках его команды и о противниках.
На конференции по системам нейронной обработки информации, которая состоится в следующем месяце, исследователи из Массачусетского технологического института (MIT) представят DeepRole, первый игровой бот, способный выигрывать многопользовательские онлайн-игры, в которых принадлежность участников к альянсам изначально неясна.
Бот сконструирован на основе стандартного ИИ-алгоритма Counterfactual Regret Minimization (CFR), используемого для игры в покер, который был расширен инновационной технологией «дедуктивных рассуждений». Это нововведение помогает программе анализировать частично видимые действия игрока, определяя вероятность того, что он относится к союзникам или к противникам — «шпионам». Таким образом бот быстро приобретает навыки налаживания взаимодействия в игре и планирования действий, ведущих к командной победе.
Исследователи выставляли DeepRole против человеческих игроков в более, чем 4 тысячах раундов онлайновой игры The Resistance: Avalon. В ней каждый из участников скрывает свою роль, но пытается выяснить роли других игроков. И в индивидуальных, и в командных играх DeepRole постоянно превосходила игроков-людей. Интересно, что программа побеждала, не пользуясь предусмотренным в игре текстовым чатом (такая функция будет реализована в следующих версиях DeepRole).
«Заменив товарища по команде на бота, вы можете ожидать более высокий процент выигрышей для своей команды. Боты — лучшие партнеры», — утверждает первый автор статьи, 18-летний Джек Серрино (Jack Serrino), сам заядлый игрок в «Avalon».
Эта работа — часть более широкого проекта, задача которого состоит в моделировании того, как люди принимают социально-информированных решений. Такая модель в дальнейшем поможет роботам лучше понимать людей, учиться у них и работать вместе с ними.
Стратегія охолодження ЦОД для епохи AI
0 |