News Release

AlphaZeroの人工知能が自己学習によって複雑なゲームで人間に勝つ

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

長きにわたり、自身がプレイするゲームで人間を破るコンピュータの能力は人工知能(AI)の進歩に向けた評価基準だと考えられてきた。今回の新しい研究ではAlphaZeroが提示された。AlphaZeroとは、チェスや将棋、囲碁といった一部の最も複雑な既存のボードゲームで超人的な熟達レベルに達するのみならず、それぞれのゲームのルール以外の予備知識なしにそのゲームの対戦を自己学習する能力を持つコンピュータプログラムである。研究の結果、あらゆるゲームの対戦を学習、そしてマスターできるゲームプレイAIの開発に向けた重要なステップが提示された。IBMのチェスプログラムであるDeep Blueが人間の世界チャンピオンを破って以降の数十年間で、ゲームプレイAIはさらに進歩して、より複雑なゲームで人間を破ることができるようになった。将棋や囲碁といったチェスよりもかなり難しい他の抽象戦略ゲームもマスターするようになった。しかし本論文の著者らによると、これらのAIシステムを動かしているアルゴリズムの多くは、ただひとつのゲームの特徴を活用し、開発者である人間が吹き込んだ「手作りの」知識や戦略に依存するように作られているという。DeepMind社のDavid Silverらは、セルフプレイでの強化学習を基本にAlphaZeroを開発した。これは汎用ゲームプレイプログラムで、人間が教え込む情報を必要とせず、代わりに繰り返し自己対戦することでチェスや将棋、囲碁を学習し、マスターする。Silverらによると、このシステムはわずか数時間の自己学習でこれら3つのゲームに特化した最先端のAIプログラムを破ることができたという。関係するPerspectiveではMurray Campbellが、チェスや将棋や囲碁といったゲームが極めて複雑であるにもかかわらず、最近のAIの進歩によりそれらは簡単に解ける問題になってしまったと書いている。その結果、AI研究者らはAIシステムに次なる一連の課題を出すために新世代のゲームや多人数でやるビデオゲームなどに注目する必要がある。

###


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.