DeepMindはAIを使ってチェスの新しいルールを作成する

DeepMindはAIを使ってチェスの新しいルールを作成する

今回、彼らは元チェス世界チャンピオンのウラジミール・クラムニクとチームを組み、AI技術にこの古代のボードゲームの最新版を再学習させるよう指導した。

[[342425]]

研究チームは、すでに極めてバランスの取れたチェスのルールシステムを改善するために、数千年の歴史を持つこのボードゲームに調整を加え始め、AIを使用して最も合理的で興味深い変更の組み合わせを見つけました。

科学者たちは、ゼロから新しいルールを自ら学び、超人的なレベルのプレイに到達できる適応型学習システム「アルファゼロ」を使用して、チームがクラムニクの助けを借りて事前に定義したチェスのルールの9つのバリエーションをテストした。

AlphaZero は、それぞれのバリエーションについて、自分自身と何万回ものゲームをプレイし、特定の盤面状況下で可能なすべての動きを分析し、新しい戦略とプレイ方法を整理しました。これを基に、クラムニク氏と研究者らは、これらのバリエーションが採用された場合に人間のプレイヤー間の競争がどのようになるかをさらに評価し、最終的には異なるルールセットが実際にゲームを改善できるかどうかを判断する予定です。

チェスは何世紀にもわたって大きく進化しており、常に新しいバリエーションが生まれています。これらのバリエーションは、この古代のスポーツの認知閾値を向上させるか、ゲームに新たな複雑さを導入することを目的としています。ルールの調整は、間違いなくゲーム戦略、プレイアビリティ、さらにはボードのダイナミクスに大きな影響を与えます。さらに、歴史的な観点から見ると、十分な数の人間のチェスプレーヤーの実際のゲームプロセスと結果を観察することによってのみ、ルール変更の実際の影響を深く理解することができます。

DeepMind の研究者は、「これらのルール変更に基づいて AlphaZero モデルをトレーニングすることで、これまで数十年かかっていた人間のゲーム プロセスを数時間で迅速にシミュレートし、次から次へと「もしも」の質問に答えることができるようになります。つまり、対応する戦略と戦術が成熟した後、さまざまなチェスのバリエーションの開発可能性はどうなるのかということです。」と述べています。

AlphaZero がテストしたルールには、プレイヤーが自分の駒を捕獲できるようにするものや、ポーンを 2 歩後退させるものなどが含まれています。研究チームはまた、「キャスリング禁止」ルールも提案しており、これにより両プレイヤー間の引き分けの可能性が大幅に減少する。

AI システムは、各バリアントで 1 秒あたり 1 手という速度で 10,000 ゲームをプレイし、その後、1 分あたり 1 手という速度でさらに 1,000 ゲームをプレイしました。ルール変更がゲームの質に与える影響をできるだけ客観的に研究するために、科学者たちは他の多くの要因も研究しました。その 1 つは、チェス プレイヤーにとって最もイライラする状況である引き分けの頻度を調べることです。

全体的に、ほとんどのバリエーションはチェスの可能性を高めており、「ステイルメイト = 勝利」という新しいルールもゲームにさらなる考慮を加えています。研究者らはまた、時間制限もゲームに決定的な影響を与えることを発見した。1分に1手でプレイするよりも、1秒に1手でプレイする方が引き分けの確率ははるかに低くなる。

ゲームを 1 秒あたり 1 手でプレイする場合、引き分けになる確率は 1 分あたり 1 手でプレイする場合よりも大幅に低くなります。

結果はまた、ほとんどのゲームで、AlphaZero が古典的なチェスの動きに固執するのではなく、新しいルールの助けを借りて前例のない戦術を積極的に採用できたことを示しました。 「これは、新しいルールが影響を与え、ゲームをより強固なものにすることを示唆している」と研究者らは述べた。

DeepMind チームは、新しいルールの下での AlphaZero の行動の統計分析を行った後、ルールのバリエーションの下で駒がどこに現れ、どのように動くかという主観的な質問に対する回答やその他の戦術的思考を含む、クラムニクの意見も参考にしました。この元世界チェスチャンピオンの参加とコメントにより、伝統的なチェス界でもこの新しいルールに注目が集まることが期待されます。

ロシアのチェスのグランドマスターは、キャスリングルールのバリエーションの廃止を長年主張しており、これは攻撃性を奨励し、盤の両側で受動的に抵抗する動機を取り除くために行われたものだと主張している。一方、クラムニクは、「ステイルメイト=勝利」というバリエーションがチェスに与える全体的な影響は小さいことも発見した。

Chess.comのチーフチェスプレイヤーであるダニー・レンシュ氏もビデオを通じてDeepMindの調査結果についてコメントした。しかしクラムニクと異なり、レンシュは「ステイルメイト=勝利」のルールがチェスのプレイ方法を大きく変える可能性を最も秘めていると考えている。

「膠着状態を引き起こす要因が排除されない限り、チェスは決してこの問題から解放されないだろう」とレンシュ氏は説明した。「膠着状態は勝利と同義であるべきだと私は固く信じている。これは初心者がチェスのさらなる可能性を探るのに役立つだけでなく、チェス盤上でのゲームのプレイ方法にも決定的な影響を与えるだろう。」

結局のところ、AlphaZero の意見は参考としてしか使用できず、どのチェス ルールのバリエーションが実際に人々に受け入れられるかを予測することはできません。それを知る唯一の方法は、人間のプレイヤーがさまざまなバリエーションをどのように採用、変更、または放棄するかを観察することです。しかし、いずれにせよ、この試みによって、より多くの友人たちが長い間忘れられていたチェス盤を再び開くことができるようになれば、それはディープマインド研究チームにとって最大の勝利となるだろう。

<<:  キャッシュに関して最も懸念される問題は何ですか?種類は何ですか?リサイクル戦略とアルゴリズム?

>>:  自動運転は飛躍的な進歩を遂げており、マスク氏は年内にL5レベルの自動運転が実現すると発言した。

ブログ    
ブログ    

推薦する

GNN の推奨システムとアプリケーション

1. GNN推奨システムの基礎となる計算能力の進化過去 20 年間にわたり、コンピューティングは進化...

Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Llama2 はオープンソースであり、無料の商用利用をサポートしているため、オープンソースの大規模...

量子機械学習モデルを構築するための Google の新しいフレームワーク、TensorFlow Quantum を探索する

[[319936]] [51CTO.com クイック翻訳] 量子コンピューティングと人工知能 (AI...

2021 年のテクノロジートレンドはどこに向かうのでしょうか? IEEEが答えを教えます

[[357471]]このほど、全人類に利益をもたらす科学技術の進歩を促進することに尽力している世界最...

仕事再開時に間接接触を避けるには?顔認識アクセス制御で徹底した予防と管理を実現

職場復帰の日が近づくにつれ、全国で生産や業務が徐々に再開されているが、同時に防疫活動も緩めてはならな...

アルゴリズムは偏っているか?他の人よりも優れていればいいのです!

[[241158]]ビッグデータダイジェスト制作編集者: Ni Ni、Chen Tongxue、A...

TensorFlow を使用してシンプルなロジスティック回帰モデルをゼロから構築する

TensorFlow は Python ベースの機械学習フレームワークです。 Coursera でロ...

Huaweiの「ブラックテクノロジー」がついに公開。サイバーバース以外にも重要なニュースがある

8月11日はHuawei Developer Conferenceの3日目であり、カンファレンスの議...

「三銃士」グループは、鉱業の諜報活動への発展を促進するためにデビューしました

我が国は鉱物資源が豊富な国であり、石炭、金属、その他の鉱物の生産地が非常に多く、我が国の鉱業開発は常...

誰でも大きなモデルを使用できます。よく構成されたプロンプトにより、簡単に始めることができます。

プロンプトは、中国語ではプロンプトワードと翻訳でき、大規模なモデルが特定のコンテンツを生成するように...

...

COVID-19パンデミックの中、米国の産業界ではロボットがアメリカ人の雇用を急速に置き換えている

海外メディアの報道によると、アマゾンはこのほど、米カリフォルニア州の倉庫の管理者が新型コロナウイルス...

AIがマーケティングオーディエンスの洞察をどのように変えるのか

[[429813]]人工知能は、企業のマーケティング範囲の拡大に大きく貢献することが証明されています...

GPT-4を無料で入手するための5つのツール

翻訳者 |陳俊レビュー | Chonglou OpenAIがもたらしたGPT-4が、世界で最も人気が...