DeepMindはAIを使ってチェスの新しいルールを作成する

DeepMindはAIを使ってチェスの新しいルールを作成する

今回、彼らは元チェス世界チャンピオンのウラジミール・クラムニクとチームを組み、AI技術にこの古代のボードゲームの最新版を再学習させるよう指導した。

[[342425]]

研究チームは、すでに極めてバランスの取れたチェスのルールシステムを改善するために、数千年の歴史を持つこのボードゲームに調整を加え始め、AIを使用して最も合理的で興味深い変更の組み合わせを見つけました。

科学者たちは、ゼロから新しいルールを自ら学び、超人的なレベルのプレイに到達できる適応型学習システム「アルファゼロ」を使用して、チームがクラムニクの助けを借りて事前に定義したチェスのルールの9つのバリエーションをテストした。

AlphaZero は、それぞれのバリエーションについて、自分自身と何万回ものゲームをプレイし、特定の盤面状況下で可能なすべての動きを分析し、新しい戦略とプレイ方法を整理しました。これを基に、クラムニク氏と研究者らは、これらのバリエーションが採用された場合に人間のプレイヤー間の競争がどのようになるかをさらに評価し、最終的には異なるルールセットが実際にゲームを改善できるかどうかを判断する予定です。

チェスは何世紀にもわたって大きく進化しており、常に新しいバリエーションが生まれています。これらのバリエーションは、この古代のスポーツの認知閾値を向上させるか、ゲームに新たな複雑さを導入することを目的としています。ルールの調整は、間違いなくゲーム戦略、プレイアビリティ、さらにはボードのダイナミクスに大きな影響を与えます。さらに、歴史的な観点から見ると、十分な数の人間のチェスプレーヤーの実際のゲームプロセスと結果を観察することによってのみ、ルール変更の実際の影響を深く理解することができます。

DeepMind の研究者は、「これらのルール変更に基づいて AlphaZero モデルをトレーニングすることで、これまで数十年かかっていた人間のゲーム プロセスを数時間で迅速にシミュレートし、次から次へと「もしも」の質問に答えることができるようになります。つまり、対応する戦略と戦術が成熟した後、さまざまなチェスのバリエーションの開発可能性はどうなるのかということです。」と述べています。

AlphaZero がテストしたルールには、プレイヤーが自分の駒を捕獲できるようにするものや、ポーンを 2 歩後退させるものなどが含まれています。研究チームはまた、「キャスリング禁止」ルールも提案しており、これにより両プレイヤー間の引き分けの可能性が大幅に減少する。

AI システムは、各バリアントで 1 秒あたり 1 手という速度で 10,000 ゲームをプレイし、その後、1 分あたり 1 手という速度でさらに 1,000 ゲームをプレイしました。ルール変更がゲームの質に与える影響をできるだけ客観的に研究するために、科学者たちは他の多くの要因も研究しました。その 1 つは、チェス プレイヤーにとって最もイライラする状況である引き分けの頻度を調べることです。

全体的に、ほとんどのバリエーションはチェスの可能性を高めており、「ステイルメイト = 勝利」という新しいルールもゲームにさらなる考慮を加えています。研究者らはまた、時間制限もゲームに決定的な影響を与えることを発見した。1分に1手でプレイするよりも、1秒に1手でプレイする方が引き分けの確率ははるかに低くなる。

ゲームを 1 秒あたり 1 手でプレイする場合、引き分けになる確率は 1 分あたり 1 手でプレイする場合よりも大幅に低くなります。

結果はまた、ほとんどのゲームで、AlphaZero が古典的なチェスの動きに固執するのではなく、新しいルールの助けを借りて前例のない戦術を積極的に採用できたことを示しました。 「これは、新しいルールが影響を与え、ゲームをより強固なものにすることを示唆している」と研究者らは述べた。

DeepMind チームは、新しいルールの下での AlphaZero の行動の統計分析を行った後、ルールのバリエーションの下で駒がどこに現れ、どのように動くかという主観的な質問に対する回答やその他の戦術的思考を含む、クラムニクの意見も参考にしました。この元世界チェスチャンピオンの参加とコメントにより、伝統的なチェス界でもこの新しいルールに注目が集まることが期待されます。

ロシアのチェスのグランドマスターは、キャスリングルールのバリエーションの廃止を長年主張しており、これは攻撃性を奨励し、盤の両側で受動的に抵抗する動機を取り除くために行われたものだと主張している。一方、クラムニクは、「ステイルメイト=勝利」というバリエーションがチェスに与える全体的な影響は小さいことも発見した。

Chess.comのチーフチェスプレイヤーであるダニー・レンシュ氏もビデオを通じてDeepMindの調査結果についてコメントした。しかしクラムニクと異なり、レンシュは「ステイルメイト=勝利」のルールがチェスのプレイ方法を大きく変える可能性を最も秘めていると考えている。

「膠着状態を引き起こす要因が排除されない限り、チェスは決してこの問題から解放されないだろう」とレンシュ氏は説明した。「膠着状態は勝利と同義であるべきだと私は固く信じている。これは初心者がチェスのさらなる可能性を探るのに役立つだけでなく、チェス盤上でのゲームのプレイ方法にも決定的な影響を与えるだろう。」

結局のところ、AlphaZero の意見は参考としてしか使用できず、どのチェス ルールのバリエーションが実際に人々に受け入れられるかを予測することはできません。それを知る唯一の方法は、人間のプレイヤーがさまざまなバリエーションをどのように採用、変更、または放棄するかを観察することです。しかし、いずれにせよ、この試みによって、より多くの友人たちが長い間忘れられていたチェス盤を再び開くことができるようになれば、それはディープマインド研究チームにとって最大の勝利となるだろう。

<<:  キャッシュに関して最も懸念される問題は何ですか?種類は何ですか?リサイクル戦略とアルゴリズム?

>>:  自動運転は飛躍的な進歩を遂げており、マスク氏は年内にL5レベルの自動運転が実現すると発言した。

ブログ    
ブログ    

推薦する

マスクは困った状況だ! Grok AI は ChatGPT を盗用した疑いがあるのでしょうか? ?

みなさんこんにちは。Ergouです。マスク氏は今日、困った状況に陥っている! X (Twitter)...

2021 年に IT 自動化と AI はどこに向かうのでしょうか?

IT自動化と人工知能技術の進歩と発展により、IT担当者の働き方は大きく変化しました。今年に入って新...

国内初の大規模模造品対策訴訟:アリババクラウドが偽造同義千聞アプリを提訴、一審で勝訴

1月16日、中国における大型モデルの偽造品撲滅活動で初の成功事例が発表された。アリババクラウドとアリ...

Python ニューラル ネットワークで自動車保険の支出を予測する

[[381201]]新しいデータセット用のニューラル ネットワーク予測モデルの開発は困難な場合があり...

人工知能は人間が理解できない量子実験を設計する

[[412058]]北京時間7月19日、量子物理学者のマリオ・クライン氏は、2016年初頭にウィーン...

感情 AI はデジタルヘルスケアの未来となるでしょうか?

進化するヘルスケアとテクノロジーの世界では、「感情 AI」と呼ばれる画期的なイノベーションが変化の兆...

データサイエンスのための Python: ニューラル ネットワーク

人工ニューラル ネットワーク (ANN) は、数学的および物理的な方法を使用して人間の脳のニューラル...

高度なランサムウェア攻撃によりAIによるサイバー防御の必要性が浮き彫りに

Deep Instinct の CIO である Carl Froggett 氏は、2024 年に予算...

AIは人類にとって脅威でしょうか?人工知能には強いものと弱いものがあるが、本当の危険は強い人工知能である

近年、科学技術分野で最もホットな言葉は人工知能であり、これは近年の人工知能の急速な発展によるものです...

ホットトピックのクイックレビュー:ドイツはシステムと技術の複数回の並行開発でAI戦略を強化

世界を見渡すと、各国の社会進歩、産業グレードアップ、国防建設などにおける科学技術の価値がますます明ら...

ニューラルネットワーク技術の進化について

ニューラル ネットワークとディープラーニング技術は、今日の高度なインテリジェント アプリケーションの...

教師あり学習か教師なし学習か?この問題は明確にされなければならない

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...