DeepMindはAIを使ってチェスの新しいルールを作成する

今回、彼らは元チェス世界チャンピオンのウラジミール・クラムニクとチームを組み、AI技術にこの古代のボードゲームの最新版を再学習させるよう指導した。

[[342425]]

研究チームは、すでに極めてバランスの取れたチェスのルールシステムを改善するために、数千年の歴史を持つこのボードゲームに調整を加え始め、AIを使用して最も合理的で興味深い変更の組み合わせを見つけました。

科学者たちは、ゼロから新しいルールを自ら学び、超人的なレベルのプレイに到達できる適応型学習システム「アルファゼロ」を使用して、チームがクラムニクの助けを借りて事前に定義したチェスのルールの9つのバリエーションをテストした。

AlphaZero は、それぞれのバリエーションについて、自分自身と何万回ものゲームをプレイし、特定の盤面状況下で可能なすべての動きを分析し、新しい戦略とプレイ方法を整理しました。これを基に、クラムニク氏と研究者らは、これらのバリエーションが採用された場合に人間のプレイヤー間の競争がどのようになるかをさらに評価し、最終的には異なるルールセットが実際にゲームを改善できるかどうかを判断する予定です。

チェスは何世紀にもわたって大きく進化しており、常に新しいバリエーションが生まれています。これらのバリエーションは、この古代のスポーツの認知閾値を向上させるか、ゲームに新たな複雑さを導入することを目的としています。ルールの調整は、間違いなくゲーム戦略、プレイアビリティ、さらにはボードのダイナミクスに大きな影響を与えます。さらに、歴史的な観点から見ると、十分な数の人間のチェスプレーヤーの実際のゲームプロセスと結果を観察することによってのみ、ルール変更の実際の影響を深く理解することができます。

DeepMind の研究者は、「これらのルール変更に基づいて AlphaZero モデルをトレーニングすることで、これまで数十年かかっていた人間のゲームプロセスを数時間で迅速にシミュレートし、次から次へと「もしも」の質問に答えることができるようになります。つまり、対応する戦略と戦術が成熟した後、さまざまなチェスのバリエーションの開発可能性はどうなるのかということです。」と述べています。

AlphaZero がテストしたルールには、プレイヤーが自分の駒を捕獲できるようにするものや、ポーンを 2 歩後退させるものなどが含まれています。研究チームはまた、「キャスリング禁止」ルールも提案しており、これにより両プレイヤー間の引き分けの可能性が大幅に減少する。

AI システムは、各バリアントで 1 秒あたり 1 手という速度で 10,000 ゲームをプレイし、その後、1 分あたり 1 手という速度でさらに 1,000 ゲームをプレイしました。ルール変更がゲームの質に与える影響をできるだけ客観的に研究するために、科学者たちは他の多くの要因も研究しました。その 1 つは、チェスプレイヤーにとって最もイライラする状況である引き分けの頻度を調べることです。

全体的に、ほとんどのバリエーションはチェスの可能性を高めており、「ステイルメイト = 勝利」という新しいルールもゲームにさらなる考慮を加えています。研究者らはまた、時間制限もゲームに決定的な影響を与えることを発見した。1分に1手でプレイするよりも、1秒に1手でプレイする方が引き分けの確率ははるかに低くなる。

ゲームを 1 秒あたり 1 手でプレイする場合、引き分けになる確率は 1 分あたり 1 手でプレイする場合よりも大幅に低くなります。

結果はまた、ほとんどのゲームで、AlphaZero が古典的なチェスの動きに固執するのではなく、新しいルールの助けを借りて前例のない戦術を積極的に採用できたことを示しました。「これは、新しいルールが影響を与え、ゲームをより強固なものにすることを示唆している」と研究者らは述べた。

DeepMind チームは、新しいルールの下での AlphaZero の行動の統計分析を行った後、ルールのバリエーションの下で駒がどこに現れ、どのように動くかという主観的な質問に対する回答やその他の戦術的思考を含む、クラムニクの意見も参考にしました。この元世界チェスチャンピオンの参加とコメントにより、伝統的なチェス界でもこの新しいルールに注目が集まることが期待されます。

ロシアのチェスのグランドマスターは、キャスリングルールのバリエーションの廃止を長年主張しており、これは攻撃性を奨励し、盤の両側で受動的に抵抗する動機を取り除くために行われたものだと主張している。一方、クラムニクは、「ステイルメイト＝勝利」というバリエーションがチェスに与える全体的な影響は小さいことも発見した。

Chess.comのチーフチェスプレイヤーであるダニー・レンシュ氏もビデオを通じてDeepMindの調査結果についてコメントした。しかしクラムニクと異なり、レンシュは「ステイルメイト＝勝利」のルールがチェスのプレイ方法を大きく変える可能性を最も秘めていると考えている。

「膠着状態を引き起こす要因が排除されない限り、チェスは決してこの問題から解放されないだろう」とレンシュ氏は説明した。「膠着状態は勝利と同義であるべきだと私は固く信じている。これは初心者がチェスのさらなる可能性を探るのに役立つだけでなく、チェス盤上でのゲームのプレイ方法にも決定的な影響を与えるだろう。」

結局のところ、AlphaZero の意見は参考としてしか使用できず、どのチェスルールのバリエーションが実際に人々に受け入れられるかを予測することはできません。それを知る唯一の方法は、人間のプレイヤーがさまざまなバリエーションをどのように採用、変更、または放棄するかを観察することです。しかし、いずれにせよ、この試みによって、より多くの友人たちが長い間忘れられていたチェス盤を再び開くことができるようになれば、それはディープマインド研究チームにとって最大の勝利となるだろう。

<<: キャッシュに関して最も懸念される問題は何ですか?種類は何ですか？リサイクル戦略とアルゴリズム?

>>: 自動運転は飛躍的な進歩を遂げており、マスク氏は年内にL5レベルの自動運転が実現すると発言した。