AIが麻雀をプレイする論文：理系の学生にとって麻雀はこう見える

AI 研究の初期の頃から、チェッカー、チェス、囲碁、ポーカーから StarCraft II に至るまで、ゲームは多くの AI 技術やアイデアのテストベッドとして機能してきました。過去数十年にわたり、AI プログラムはチェッカー、チェス、囲碁などの完全情報ゲームで人間のプレイヤーに一貫して勝利してきました。これらのゲームでは、プレイヤーは決定を下す前にすべての情報にアクセスできます。それに比べて、不完全情報ゲームはより困難です。最近、AI は、人間が競争的にプレイする最小のポーカーのバリエーションである 2 人対戦のヘッズアップゲームの両方で重要な進歩を遂げました。この論文では、研究者らは、より人気があり複雑なゲームである麻雀について数学と AI の研究を実施しました。

[[259359]]

麻雀は世界中で人気のあるマルチプレイヤーゲームです。麻雀には漢字や記号が書かれた牌が 144 枚あります (図 1 を参照)。プレイや得点のルールは柔軟で多様です。最初、各プレイヤーは 13 枚のカードを持っています。次に、勝ちカードが 14 枚になるまでカードを引いてプレイします。

この論文では、研究者らが麻雀に関する数学的および AI 研究を実施し、最も基本的な 2 つの質問に答えようとしました。現在の 14 枚のカードのデッキはどれほど優れているか? どのカードをプレイすべきか? 著者は、不足カードの数の概念を定義し、k 枚のカード変更 (k ≥ 1) の条件下で勝利の確率を高めるために、現在プレイするカードを決定するための比較的最適な戦略を提案しました。

本稿では、問題を単純化するために、最も基本的な麻雀のプレイ方法である麻雀-0のみを検討します。他のプレイスタイルも同様に扱うことができます。麻雀0では、カードの種類は次の3つだけです。

ストリップ: B1 から B9 までは、1 から 9 個のストリップ (各カテゴリに 4 枚ずつ) を意味します。
1 万: C1 から C9 まで、1 万から 9 万を意味し、各カテゴリに 4 枚のカードがあります。
トング: D1 から D9 は 1 つのトングから 9 つのトングを表し、各カテゴリに 4 枚のカードがあります。

この論文では、カードをB、C、Dと呼び、麻雀セット全体をM_0（合計108枚）と呼びます。

麻雀のルール

定義 1: アイは 1 組の同一のカードを指し、コングは 3 枚または 4 枚の同一のカードを指します。チャウとは、同じ種類のカードが 3 枚連続していることを指します。ゴング、プン、またはストレートはメルドと呼ばれます。

この論文では、著者らはいくつかの非標準的な概念も提示しています。

定義 2: 擬似チョウ (略称 pchow) とは、カードを 1 枚食べるとストレートになる可能性がある同じスートのカードのペアを指します。擬似メルド（略して pmeld）は、食べられるカードまたはペアです。カード c はカード ab とグループを形成し、それがハンド (abc) となります。同様に、カード t と別の t を組み合わせると、一般カードになります。たとえば、B3B4B5 はキャプチャ、C1C1 はジェネラル、B7B7B7 はタッチ、D9D9D9D9 はギャング、B1B3 と C2C3 はどちらもキャプチャを意味します。

論文の後半では、純色とは何か、完全な手札を構成するもの（手札の勝ち）など、多くの正式な麻雀ルールを紹介しています。たとえば、定義 4 は 14 枚のカードの標準形式を示しています。ここで、著者は B、C、D を 0、1、2 として表しているため、(0, 3) は B3、つまり 3 枚の組み合わせを意味します。

カードの組み合わせを定義した後、現在の 14 枚のカードが勝利からどれだけ離れているかを判断するための測定方法が必要です。ここで、著者は欠陥の数を紹介しています。簡単に言えば、不足しているカードの数は、勝つために現在の手札から不足しているカードの枚数を示します。

理系の学生はカードをどのように見ているのでしょうか?

ランダムな 14 枚のカードのハンドにおけるカードの表現と不足しているカードの数を定義したら、次に必要なのは、現在のカードの品質を評価し、カードをプレイして不足しているカードの数を 0 に減らす方法を知ることだけです。まず、14 枚のカードの手札の場合、不足しているカードの数は 3 枚以下です。論文の第 3 章では、主にこの点について議論し、証明します。

純粋なカードのスートの場合、不足しているカードの数は、次の場合にのみ 3 になります。

通常のカードの場合、不足するカードの上限は 6 枚です。論文の第 4 章では、主にこの点について議論し、証明します。

これで、不足しているカードの数の定義と証明に基づいて、現在のハンドの質を測定できるようになりました。まず、カードがなくなった後の完全なハンドを定義し、次にカードがなくなったことと勝利との間のコストを計算する必要があります。

ここで例を挙げてみましょう。引いた 14 枚のカードが次のとおりである場合: T = (B1B1B2B2B2B2B3B3)(C1C2C8)(D2D2D8)、ここで C2 は 2 万を表します。 p 分解は次のように表現できます。

π_0 にはすでに 4 枚の B2 カードがあるため、π_0 の (B1 B3) はシーケンスを形成できません。 π_1 と π_2 は両方とも飽和しており、完全に組み合わせることができます。たとえば、π_1 の欠けているカードは次のとおりです。

そのコストはコスト(π_1) = 4です。理想的なコストを決定した後、理想的な戦略を見つけて、最小のラウンド数でコストまたは不足しているカードの数を 0 に減らす必要があります。もちろん、カードをプレイするプロセスをモデル化し、理想的な戦略を見つけるには、さらなる研究が必要です。

結論と考察

本論文では、著者は麻雀に関する数学的および AI 的研究を開始しました。本稿では、麻雀をプレイするためのコンピュータプログラムを設計するにあたり、まず、不足カードの枚数の定義、知識ベースの概念、およびステップ k 値が重要な役割を果たすことについて説明します。

麻雀は非常に人気のあるゲームですが、麻雀を専門に研究した数学や AI の論文はほとんどありません。私たちの知る限り、数学的手法（主に基礎的な組合せ理論）を用いて麻雀を真剣に研究した論文は、Yuan Chengらの論文[4]のみである。その論文では、著者らは麻雀における特別な組み合わせ問題、すなわち k ゲート問題を研究しました。

純粋な 13 枚のカードのハンド T は 9 ゲートと呼ばれ、同じ種類の任意のカードを T に追加して勝つことができます。 1 ≤ k ≤ 9 の場合、異なる値のカードが K 枚あり、これらの k 枚のカードのみが T を完了できる場合、T は k ゲート問題と呼ぶことができます。この論文で構築された形式表現を使用して k ゲート問題を記述できることは容易にわかります。すべての k ゲートを見つけるには、T を i に追加することで完成するカードがちょうど k 枚あるかどうかに関係なく、13 枚のカードのセットごとに決定を下すだけで済みます。

上記の研究を拡張できる方向は少なくとも 3 つあります。まず、M_0 に、東、南、西、北などの風カード、赤中心、運勢、白板などの矢印カード、花カードなど、より多くのカードを含めることができます。次に、7 ペアを許可したり、少なくとも 2 つのスーツを要求するなど、14 枚のカードのハンドルールを増減できます。 3 番目に、14 枚のカードのハンドはそれぞれ異なるスコアを持つ場合があります。たとえば、純粋なスーツのスコアはランダムなハンドよりも高くなります。将来の研究ではこれらの問題に対処しようとする可能性があります。

論文：麻雀をやろう！

論文アドレス: https://arxiv.org/pdf/1903.03294.pdf

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart（id:almosthuman2014）」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<: ブロックチェーンと人工知能、統合開発の「win-winゲーム」

>>: ガートナー: 人工知能に関するよくある誤解5つ