News Release 

ついにAIが6人プレイのポーカーで人間を打ち負かす

American Association for the Advancement of Science

2人のプレーヤーだけが参加するという設定を上回ることによって、人工知能(AI)の一つの節目を超えることで、6人プレイで掛け金無制限のテキサスホールデムポーカー(現状プレイされるポーカーの最もポピュラーな形態)で人間のトッププロを凌ぐことができるAIを研究者らが紹介している。このシステムは今回の複数人プレイのゲームにおいてプロのポーカープレーヤーたちを打ち負かした唯一のAIである。研究者らは近年の人工知能における飛躍的な前進について報告している。ゲームはAIの進展にとって挑戦的課題、基準点および道しるべとしての役割をしばしば果たしている。しかしながら、特にポーカーは従来から2人超のプレーヤーでプレイされているにもかかわらず、ポーカーを含め、そのような基準点としての過去の成功例は大部分が2人プレイのゲームに限定されていた。複数人プレイのゲームは2人プレイのゲームを超えたAIに対する追加の基本的課題である。今回、「アクション抽象化」および「情報抽象化」を含むアプローチを適用して、これらの基本的課題のいくつかを克服し、特に、今回のAIが検討する必要のある種々の異なる動作についてはその数を低減することにより、Noam BrownおよびTuomas Sandholmは「Pluribus」と称するプログラムを開発している。このプログラムでは、自身の5つの複製に対してプレイすることにより、6人プレイで掛け金無制限のテキサスホールデムポーカーのプレイ方法を学習した。5人の精鋭プロポーカープレーヤーと対戦した時またはPluribusの5つの複製が1人のプロに対してプレイした時、このコンピュータプログラムはかなり良好な成績を示した。リンプ(のろのろ進むこと:「ビッグブラインド」にコールはしても、フォールドまたはレイズはしない)は、ルールによりポット(テーブル中央)にビッグブラインドの半額を既に出しているため、コールするためには他のプレーヤーたちの半額を出さなければならず、「スモールブラインド」のプレーヤーを除き、プレーヤーにとって次善の策であるという通常の人間の知恵がPluribusによって確認されたと今回の著者らは述べている。今回の発見は7月3日に始まるワールドシリーズオブポーカーメインイベント第50版として出版される。

###

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.