News Release

1人称視点マルチプレイヤービデオゲームにおいて「勝利を目指す」DeepMindの新ゲームAI

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

新たな研究によると、DeepMindの研究者らがゲームAI(人工知能)を学習させることで、人気のある1人称視点3Dマルチプレイヤービデオゲームを人間のような技能で行わせた。しかしこれは以前では乗り越えられない課題であった。強化学習という形でトレーニングされたAIエージェントは、尋常ではない能力を発揮し、独立して学習するという高度の戦略を立案・使用することで、ゲーム環境で競争や協力を行った。強化学習(RL)は、人工知能エージェントを学習させる方法であり、ゲームAIの生産を成功させている。これらのゲームAIは、複雑化するシングルプレイヤーゲーム環境においてナビゲーションを行うことができることに加えて、チェスや碁などの2人で競うターン制ゲームでは超人的な勝利を収めることができている。しかしながら、マルチプレイヤーゲーム、特に、独立したマルチプレイヤー間のチームワークおよび相互作用が関係するゲームを競う能力は今までのところAIシステムの能力を超えていた。今回、Max JaderbergらはRLによって学習したAIエージェントを紹介しており、このAIエージェントは、影響力の大きい1人称視点3Dマルチプレイヤービデオゲームである「Quake III Arena」のキャプチャー・ザ・フラグにおいて人間レベルの成績を挙げることができている。以前の研究では、例えば、AIエージェントに対してゲーム環境、すなはち、他のプレイヤーの状態に関する「知識」が提供されるが、これとは対照的に、JaderbergらのRLによるアプローチによって、各エージェントが「見る」ことができるもの(「ピクセル」)およびゲームスコアだけを使用して、各エージェントが自身の経験から独自に学習することが保障されている。バーチャルプレイヤーの集団は、お互いに競い合わされて学習して、無作為に生成された環境においてゲームを数千回超行った。今回の論文の著者らによると、これらのAIエージェントは、時間の経過とともに、熟練した人間のプレイヤーによって使用される戦略とは異なり、驚くほど高度な戦略を独自に組み立てている。さらに、これらのAIエージェントは、人間のプレイヤーと競うゲームにおいて、反応時間が人間のレベルに引き下げられた時でさえ、人間の対戦相手を凌駕する能力を示すだけでなく、人間およびコンピュータの臨時混成チームを編成して協力する能力も示した。

###


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.