DeepMindはAIを使ってチェスの新しいルールを作成する

DeepMindはAIを使ってチェスの新しいルールを作成する

今回、彼らは元チェス世界チャンピオンのウラジミール・クラムニクとチームを組み、AI技術にこの古代のボードゲームの最新版を再学習させるよう指導した。

[[342425]]

研究チームは、すでに極めてバランスの取れたチェスのルールシステムを改善するために、数千年の歴史を持つこのボードゲームに調整を加え始め、AIを使用して最も合理的で興味深い変更の組み合わせを見つけました。

科学者たちは、ゼロから新しいルールを自ら学び、超人的なレベルのプレイに到達できる適応型学習システム「アルファゼロ」を使用して、チームがクラムニクの助けを借りて事前に定義したチェスのルールの9つのバリエーションをテストした。

AlphaZero は、それぞれのバリエーションについて、自分自身と何万回ものゲームをプレイし、特定の盤面状況下で可能なすべての動きを分析し、新しい戦略とプレイ方法を整理しました。これを基に、クラムニク氏と研究者らは、これらのバリエーションが採用された場合に人間のプレイヤー間の競争がどのようになるかをさらに評価し、最終的には異なるルールセットが実際にゲームを改善できるかどうかを判断する予定です。

チェスは何世紀にもわたって大きく進化しており、常に新しいバリエーションが生まれています。これらのバリエーションは、この古代のスポーツの認知閾値を向上させるか、ゲームに新たな複雑さを導入することを目的としています。ルールの調整は、間違いなくゲーム戦略、プレイアビリティ、さらにはボードのダイナミクスに大きな影響を与えます。さらに、歴史的な観点から見ると、十分な数の人間のチェスプレーヤーの実際のゲームプロセスと結果を観察することによってのみ、ルール変更の実際の影響を深く理解することができます。

DeepMind の研究者は、「これらのルール変更に基づいて AlphaZero モデルをトレーニングすることで、これまで数十年かかっていた人間のゲーム プロセスを数時間で迅速にシミュレートし、次から次へと「もしも」の質問に答えることができるようになります。つまり、対応する戦略と戦術が成熟した後、さまざまなチェスのバリエーションの開発可能性はどうなるのかということです。」と述べています。

AlphaZero がテストしたルールには、プレイヤーが自分の駒を捕獲できるようにするものや、ポーンを 2 歩後退させるものなどが含まれています。研究チームはまた、「キャスリング禁止」ルールも提案しており、これにより両プレイヤー間の引き分けの可能性が大幅に減少する。

AI システムは、各バリアントで 1 秒あたり 1 手という速度で 10,000 ゲームをプレイし、その後、1 分あたり 1 手という速度でさらに 1,000 ゲームをプレイしました。ルール変更がゲームの質に与える影響をできるだけ客観的に研究するために、科学者たちは他の多くの要因も研究しました。その 1 つは、チェス プレイヤーにとって最もイライラする状況である引き分けの頻度を調べることです。

全体的に、ほとんどのバリエーションはチェスの可能性を高めており、「ステイルメイト = 勝利」という新しいルールもゲームにさらなる考慮を加えています。研究者らはまた、時間制限もゲームに決定的な影響を与えることを発見した。1分に1手でプレイするよりも、1秒に1手でプレイする方が引き分けの確率ははるかに低くなる。

ゲームを 1 秒あたり 1 手でプレイする場合、引き分けになる確率は 1 分あたり 1 手でプレイする場合よりも大幅に低くなります。

結果はまた、ほとんどのゲームで、AlphaZero が古典的なチェスの動きに固執するのではなく、新しいルールの助けを借りて前例のない戦術を積極的に採用できたことを示しました。 「これは、新しいルールが影響を与え、ゲームをより強固なものにすることを示唆している」と研究者らは述べた。

DeepMind チームは、新しいルールの下での AlphaZero の行動の統計分析を行った後、ルールのバリエーションの下で駒がどこに現れ、どのように動くかという主観的な質問に対する回答やその他の戦術的思考を含む、クラムニクの意見も参考にしました。この元世界チェスチャンピオンの参加とコメントにより、伝統的なチェス界でもこの新しいルールに注目が集まることが期待されます。

ロシアのチェスのグランドマスターは、キャスリングルールのバリエーションの廃止を長年主張しており、これは攻撃性を奨励し、盤の両側で受動的に抵抗する動機を取り除くために行われたものだと主張している。一方、クラムニクは、「ステイルメイト=勝利」というバリエーションがチェスに与える全体的な影響は小さいことも発見した。

Chess.comのチーフチェスプレイヤーであるダニー・レンシュ氏もビデオを通じてDeepMindの調査結果についてコメントした。しかしクラムニクと異なり、レンシュは「ステイルメイト=勝利」のルールがチェスのプレイ方法を大きく変える可能性を最も秘めていると考えている。

「膠着状態を引き起こす要因が排除されない限り、チェスは決してこの問題から解放されないだろう」とレンシュ氏は説明した。「膠着状態は勝利と同義であるべきだと私は固く信じている。これは初心者がチェスのさらなる可能性を探るのに役立つだけでなく、チェス盤上でのゲームのプレイ方法にも決定的な影響を与えるだろう。」

結局のところ、AlphaZero の意見は参考としてしか使用できず、どのチェス ルールのバリエーションが実際に人々に受け入れられるかを予測することはできません。それを知る唯一の方法は、人間のプレイヤーがさまざまなバリエーションをどのように採用、変更、または放棄するかを観察することです。しかし、いずれにせよ、この試みによって、より多くの友人たちが長い間忘れられていたチェス盤を再び開くことができるようになれば、それはディープマインド研究チームにとって最大の勝利となるだろう。

<<:  キャッシュに関して最も懸念される問題は何ですか?種類は何ですか?リサイクル戦略とアルゴリズム?

>>:  自動運転は飛躍的な進歩を遂げており、マスク氏は年内にL5レベルの自動運転が実現すると発言した。

ブログ    

推薦する

初めて人間を超えた! 「絵を読んで意味を理解する」ことに関しては、AIは人間の目よりも優れている

[[417746]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

99.9%の精度!小園口算は算数の問題をAIで訂正しており、誤り率は小学校教師の10分の1に過ぎない。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2019年の人工知能の予測と展望

2019 年に人工知能の分野はどのように進化するでしょうか? 過去数年と比べてどのように変化するでし...

人工知能の力:デジタル創造性から金融技術まで、知能は新たな機会をもたらす

人工知能、モノのインターネット、産業インターネットなどがもたらすインテリジェント化の波は、技術発展の...

ロボットは銀行業務を破壊するのか?

[[223220]]世界経済フォーラムの最近のレポートでは、2020年までに先進国で500万の雇用...

会話型AI: パンデミック時代の最先端技術

パンデミックの発生により、世界中の労働システムが危険にさらされています。コンタクト センターの従業員...

無料の Python 機械学習コース 8: 精度と再現率

機械学習における偏ったデータセットの扱い方偏ったデータセットで効果的な機械学習アルゴリズムを開発する...

AI導入における主な障壁とその解決策

COVID-19 パンデミックにより、企業はデジタル変革の取り組みを数か月、場合によっては数年も加速...

AIが有名人に似た人を紹介

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

...

自動運転の3D視覚認識アルゴリズムを理解するための1万語

自動運転アプリケーションでは、最終的には 3D シーン認識が必要になります。理由は簡単です。車は画像...

約100機のドローンが「爆発」し、重慶の建物に墜落した!プログラムエラー、ホストクラッシュ

ドローンが墜落することは珍しくありませんが、数十機、あるいは数百機ものドローンが同時に墜落したらどう...

百度のAIが海淀区の「スマートスクリーン」を実現、1秒で全状況を把握

今年初め、海淀シティブレインのインテリジェントオペレーションコマンドセンター(IOCC)が正式に公開...

...