AI 研究の初期の頃から、チェッカー、チェス、囲碁、ポーカーから StarCraft II に至るまで、ゲームは多くの AI 技術やアイデアのテストベッドとして機能してきました。過去数十年にわたり、AI プログラムはチェッカー、チェス、囲碁などの完全情報ゲームで人間のプレイヤーに一貫して勝利してきました。これらのゲームでは、プレイヤーは決定を下す前にすべての情報にアクセスできます。それに比べて、不完全情報ゲームはより困難です。最近、AI は、人間が競争的にプレイする最小のポーカーのバリエーションである 2 人対戦のヘッズアップ ゲームの両方で重要な進歩を遂げました。この論文では、研究者らは、より人気があり複雑なゲームである麻雀について数学と AI の研究を実施しました。
麻雀は世界中で人気のあるマルチプレイヤーゲームです。麻雀には漢字や記号が書かれた牌が 144 枚あります (図 1 を参照)。プレイや得点のルールは柔軟で多様です。最初、各プレイヤーは 13 枚のカードを持っています。次に、勝ちカードが 14 枚になるまでカードを引いてプレイします。 この論文では、研究者らが麻雀に関する数学的および AI 研究を実施し、最も基本的な 2 つの質問に答えようとしました。現在の 14 枚のカードのデッキはどれほど優れているか? どのカードをプレイすべきか? 著者は、不足カードの数の概念を定義し、k 枚のカード変更 (k ≥ 1) の条件下で勝利の確率を高めるために、現在プレイするカードを決定するための比較的最適な戦略を提案しました。 本稿では、問題を単純化するために、最も基本的な麻雀のプレイ方法である麻雀-0のみを検討します。他のプレイスタイルも同様に扱うことができます。麻雀0では、カードの種類は次の3つだけです。
この論文では、カードをB、C、Dと呼び、麻雀セット全体をM_0(合計108枚)と呼びます。 麻雀のルール 定義 1: アイは 1 組の同一のカードを指し、コングは 3 枚または 4 枚の同一のカードを指します。チャウとは、同じ種類のカードが 3 枚連続していることを指します。ゴング、プン、またはストレートはメルドと呼ばれます。 この論文では、著者らはいくつかの非標準的な概念も提示しています。 定義 2: 擬似チョウ (略称 pchow) とは、カードを 1 枚食べるとストレートになる可能性がある同じスートのカードのペアを指します。擬似メルド(略して pmeld)は、食べられるカードまたはペアです。カード c はカード ab とグループを形成し、それがハンド (abc) となります。同様に、カード t と別の t を組み合わせると、一般カードになります。たとえば、B3B4B5 はキャプチャ、C1C1 はジェネラル、B7B7B7 はタッチ、D9D9D9D9 はギャング、B1B3 と C2C3 はどちらもキャプチャを意味します。 論文の後半では、純色とは何か、完全な手札を構成するもの(手札の勝ち)など、多くの正式な麻雀ルールを紹介しています。たとえば、定義 4 は 14 枚のカードの標準形式を示しています。ここで、著者は B、C、D を 0、1、2 として表しているため、(0, 3) は B3、つまり 3 枚の組み合わせを意味します。 カードの組み合わせを定義した後、現在の 14 枚のカードが勝利からどれだけ離れているかを判断するための測定方法が必要です。ここで、著者は欠陥の数を紹介しています。簡単に言えば、不足しているカードの数は、勝つために現在の手札から不足しているカードの枚数を示します。 理系の学生はカードをどのように見ているのでしょうか? ランダムな 14 枚のカードのハンドにおけるカードの表現と不足しているカードの数を定義したら、次に必要なのは、現在のカードの品質を評価し、カードをプレイして不足しているカードの数を 0 に減らす方法を知ることだけです。まず、14 枚のカードの手札の場合、不足しているカードの数は 3 枚以下です。論文の第 3 章では、主にこの点について議論し、証明します。 純粋なカードのスートの場合、不足しているカードの数は、次の場合にのみ 3 になります。 通常のカードの場合、不足するカードの上限は 6 枚です。論文の第 4 章では、主にこの点について議論し、証明します。 これで、不足しているカードの数の定義と証明に基づいて、現在のハンドの質を測定できるようになりました。まず、カードがなくなった後の完全なハンドを定義し、次にカードがなくなったことと勝利との間のコストを計算する必要があります。 ここで例を挙げてみましょう。 引いた 14 枚のカードが次のとおりである場合: T = (B1B1B2B2B2B2B3B3)(C1C2C8)(D2D2D8)、ここで C2 は 2 万を表します。 p 分解は次のように表現できます。 π_0 にはすでに 4 枚の B2 カードがあるため、π_0 の (B1 B3) はシーケンスを形成できません。 π_1 と π_2 は両方とも飽和しており、完全に組み合わせることができます。たとえば、π_1 の欠けているカードは次のとおりです。 そのコストはコスト(π_1) = 4です。理想的なコストを決定した後、理想的な戦略を見つけて、最小のラウンド数でコストまたは不足しているカードの数を 0 に減らす必要があります。もちろん、カードをプレイするプロセスをモデル化し、理想的な戦略を見つけるには、さらなる研究が必要です。 結論と考察 本論文では、著者は麻雀に関する数学的および AI 的研究を開始しました。本稿では、麻雀をプレイするためのコンピュータ プログラムを設計するにあたり、まず、不足カードの枚数の定義、知識ベースの概念、およびステップ k 値が重要な役割を果たすことについて説明します。 麻雀は非常に人気のあるゲームですが、麻雀を専門に研究した数学や AI の論文はほとんどありません。私たちの知る限り、数学的手法(主に基礎的な組合せ理論)を用いて麻雀を真剣に研究した論文は、Yuan Chengらの論文[4]のみである。その論文では、著者らは麻雀における特別な組み合わせ問題、すなわち k ゲート問題を研究しました。 純粋な 13 枚のカードのハンド T は 9 ゲートと呼ばれ、同じ種類の任意のカードを T に追加して勝つことができます。 1 ≤ k ≤ 9 の場合、異なる値のカードが K 枚あり、これらの k 枚のカードのみが T を完了できる場合、T は k ゲート問題と呼ぶことができます。この論文で構築された形式表現を使用して k ゲート問題を記述できることは容易にわかります。すべての k ゲートを見つけるには、T を i に追加することで完成するカードがちょうど k 枚あるかどうかに関係なく、13 枚のカードのセットごとに決定を下すだけで済みます。 上記の研究を拡張できる方向は少なくとも 3 つあります。まず、M_0 に、東、南、西、北などの風カード、赤中心、運勢、白板などの矢印カード、花カードなど、より多くのカードを含めることができます。次に、7 ペアを許可したり、少なくとも 2 つのスーツを要求するなど、14 枚のカードのハンド ルールを増減できます。 3 番目に、14 枚のカードのハンドはそれぞれ異なるスコアを持つ場合があります。たとえば、純粋なスーツのスコアはランダムなハンドよりも高くなります。将来の研究ではこれらの問題に対処しようとする可能性があります。 論文:麻雀をやろう! 論文アドレス: https://arxiv.org/pdf/1903.03294.pdf [この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です] この著者の他の記事を読むにはここをクリックしてください |
<<: ブロックチェーンと人工知能、統合開発の「win-winゲーム」
8月31日、人工知能(AI)がチェスやビデオゲームなどの分野で人間に勝利した。そして今回初めて、人間...
人工知能は医療業界のシステムと方法を変えています。半世紀以上にわたり、人工知能とヘルスケアは一緒に発...
いくつかの指標によれば、生成的敵対的ネットワーク (GAN) の研究は過去 2 年間で大きな進歩を遂...
翻訳者 |陳俊レビュー | Chonglou異常検出は、企業が競合他社よりも先に今後のトレンドを特定...
ご存知のとおり、コンピューティング パワーの文字通りの意味はコンピューティング能力です。 「コンピュ...
[51CTO.com からのオリジナル記事] ローカルライフのシナリオには、メニュー認識、標識認識、...
[[427302]]ガートナーの新しい調査によると、人工知能 (AI) 技術計画を持つテクノロジーお...
多くの人が人工知能技術の導入に非常に興味を持っていることは間違いありません。しかし、世界的な調査によ...
2018 CES(国際コンシューマー・エレクトロニクス・ショー)が1月9日から12日まで米国ラスベガ...
ウェブサイトのランキングは、ウェブサイトの最適化を行うすべての人が最も気にしていることです。しかし、...
自動化されたモバイル ホーム ロボットの複雑さを探り、セットアップの特有の課題と制約の克服に焦点を当...
太い眉毛と大きな目を持つ「強化学習の専門家」も、大規模言語モデルに取り組み始めているのでしょうか? ...
デジタル変革の後半期に入る中、デジタルとリアルの融合をいかに加速し、グリーン・低炭素の発展へと向かう...