ИИ DeepMind победил людей в кооперативной игре Quake III Arena

Сотрудники британской компании DeepMind, которая с 2014 года принадлежит Google, опубликовали статью в журнале Science, посвященную успехам их искусственного интеллекта.

На этот раз они смогли натренировать алгоритм на командную игру в режиме «Захват флага» мультиплеерного шутера Quake III Arena. Команда из агентов ИИ в подавляющем количестве игр победила команду людей.

Для тренировки агентов специалисты использовали обучение с подкреплением — метод машинного обучения, при котором система учится, взаимодействуя со средой. Авторы статьи пишут, что этот метод успешно зарекомендовал себя в обучении одного агента, но они хотели узнать, насколько он успешен при командной работе.

В качестве платформы они выбрали мультиплеерный шутер от первого лица Quake III Arena, но задали свои условия игры. Во-первых, карты каждый раз генерируются случайно. Во-вторых, в матче принимают участие только четыре игрока: по два с каждой стороны. Соревнование проходит только в одном режиме — «Захват флага»: каждая из команд должна одновременно защитить свой флаг, захватить флаг оппонентов и принести на свою базу. Реакцию системы снизили до средних показателей человека.

Авторы тренировали 30 агентов. Тренировка происходила благодаря многотысячным параллельным партиям, которые отыгрывали агенты. При этом каждый агент представлял собой индивидуальную единицу, которая действует самостоятельно, исходя из обучения с подкреплением. Специалисты также демонстрируют филогенетическое дерево, которое строится в ходе этого обучения.

После тренировок алгоритмы сыграли несколько партий с командой людей. Обе команды играли на неизвестных для них картах. Пара агентов за игру в среднем захватывала на 16 флагов больше, чем пара людей. Только когда человек играл в партнерстве с искусственным интеллектом, ему удавалось выиграть у объединения алгоритмов (5% вероятности победы).

Профессор Технологического колледжа Джорджии Марк Ридл (Mark Riedl) раскритиковал такой подход британской фирмы, сказав, что агенты не обмениваются сообщениями, а лишь реагируют на те события, которые происходят в игре. Однако представитель DeepMind Макс Джадерберг (Max Jaderberg) возразил:

«[В нашей симуляции] один из агентов сидит в лагере противника, ожидая, когда вновь появится флаг, это возможно только потому, что он полагается на своего партнера по команде».

Джадерберг говорит об одной из тактик искусственного интеллекта, выработанной тем в ходе обучения, которая предполагает ожидание появления нового флага в лагере оппонента. Ее часто используют и люди.

В январе DeepMind сообщила, что ее искусственный интеллект AlphaStar одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени.

Источник: naked-science.ru

Подписывайтесь на канал «Хвилі» в Telegram, на канал «Хвилі» в Youtube, страницу «Хвилі» в Facebook

Популярні новини зараз

ИИ DeepMind победил людей в кооперативной игре Quake III Arena

"Для "Шахедів" не потрібні F-16": авіаконструктор розповів, як Україна могла створити дешеву ударну авіацію

Які банани в магазині треба обходити стороною: це знає не кожен

Драгі поставив Європу перед вибором: федерація чи підпорядкування США та Китаю

Виплати повернуть заднім числом: в Україні готують термінове рішення для пенсіонерів

Lidl, Biedronka чи Auchan: українцям у Польщі підказали, де закуповуватися найвигідніше

Блокування мобільного зв'язку під час атак дронів: що чекає на українців

Росія, на вихід: у Перській затоці швидко знайшли заміну путінській нафті, – Reuters

The Financial Times: Націоналіст перемагає на президентських виборах у Польщі

«Стара корупційна практика»: ДОТ Жумаділова переплатив 86 млн грн «зручному» постачальнику їжі для армії

Агентство Fitch знизило рейтинг України

Сакварелідзе не бачить слідів, які у скандалі навколо Гізо Углави ведуть до ОП

Відсторонення заступника директора НАБУ Гізо Углави свідчить про навмисний політичний тиск на Бюро – військовий

Група компаній SHERIFF стала жертвою злочинної змови, — ЗМІ

Чверть українців приділяє новинам найбільше часу в месенджері — опитування Viber

Українські ГО STEM is FEM та Impact Force надають ноутбуки дітям для продовження навчання під час війни: як отримати

Поліція влаштувала маски-шоу в київському готелі для рольових ігор

Ложкін прогнозує Україні майбутнє «Ізраїлю Східної Європи»

Procter&Gamble визнано міжнародним спонсором війни в Україні

Міноборони заявляє про нульову толерантність до корупції та обіцяє перевірку «харчового» скандалу

Найбільші інвестиції в державне майно в 2022 році. Підсумки приватизації

В Україні дорожчає пальне: АЗС підвищили ціни на бензин і автогаз, дизель подешевшав

Затримка із завершенням будівництва в Україні до 70% новобудов може скласти понад 1 рік, - експерт

Сергій Касьянов про те, чого чекають від уряду українські аграрії

ОККО, Авіс, Укрнафта та інші АЗС оновили ціни на бензин, дизпаливо та автогаз у різних областях