AIが麻雀をプレイする論文:理系の学生にとって麻雀はこう見える

AIが麻雀をプレイする論文:理系の学生にとって麻雀はこう見える

AI 研究の初期の頃から、チェッカー、チェス、囲碁、ポーカーから StarCraft II に至るまで、ゲームは多くの AI 技術やアイデアのテストベッドとして機能してきました。過去数十年にわたり、AI プログラムはチェッカー、チェス、囲碁などの完全情報ゲームで人間のプレイヤーに一貫して勝利してきました。これらのゲームでは、プレイヤーは決定を下す前にすべての情報にアクセスできます。それに比べて、不完全情報ゲームはより困難です。最近、AI は、人間が競争的にプレイする最小のポーカーのバリエーションである 2 人対戦のヘッズアップ ゲームの両方で重要な進歩を遂げました。この論文では、研究者らは、より人気があり複雑なゲームである麻雀について数学と AI の研究を実施しました。

[[259359]]

麻雀は世界中で人気のあるマルチプレイヤーゲームです。麻雀には漢字や記号が書かれた牌が 144 枚あります (図 1 を参照)。プレイや得点のルールは柔軟で多様です。最初、各プレイヤーは 13 枚のカードを持っています。次に、勝ちカードが 14 枚になるまでカードを引いてプレイします。

この論文では、研究者らが麻雀に関する数学的および AI 研究を実施し、最も基本的な 2 つの質問に答えようとしました。現在の 14 枚のカードのデッキはどれほど優れているか? どのカードをプレイすべきか? 著者は、不足カードの数の概念を定義し、k 枚のカード変更 (k ≥ 1) の条件下で勝利の確率を高めるために、現在プレイするカードを決定するための比較的最適な戦略を提案しました。

本稿では、問題を単純化するために、最も基本的な麻雀のプレイ方法である麻雀-0のみを検討します。他のプレイスタイルも同様に扱うことができます。麻雀0では、カードの種類は次の3つだけです。

  • ストリップ: B1 から B9 までは、1 から 9 個のストリップ (各カテゴリに 4 枚ずつ) を意味します。
  • 1 万: C1 から C9 まで、1 万から 9 万を意味し、各カテゴリに 4 枚のカードがあります。
  • トング: D1 から D9 は 1 つのトングから 9 つのトングを表し、各カテゴリに 4 枚のカードがあります。

この論文では、カードをB、C、Dと呼び、麻雀セット全体をM_0(合計108枚)と呼びます。

麻雀のルール

定義 1: アイは 1 組の同一のカードを指し、コングは 3 枚または 4 枚の同一のカードを指します。チャウとは、同じ種類のカードが 3 枚連続していることを指します。ゴング、プン、またはストレートはメルドと呼ばれます。

この論文では、著者らはいくつかの非標準的な概念も提示しています。

定義 2: 擬似チョウ (略称 pchow) とは、カードを 1 枚食べるとストレートになる可能性がある同じスートのカードのペアを指します。擬似メルド(略して pmeld)は、食べられるカードまたはペアです。カード c はカード ab とグループを形成し、それがハンド (abc) となります。同様に、カード t と別の t を組み合わせると、一般カードになります。たとえば、B3B4B5 はキャプチャ、C1C1 はジェネラル、B7B7B7 はタッチ、D9D9D9D9 はギャング、B1B3 と C2C3 はどちらもキャプチャを意味します。

論文の後半では、純色とは何か、完全な手札を構成するもの(手札の勝ち)など、多くの正式な麻雀ルールを紹介しています。たとえば、定義 4 は 14 枚のカードの標準形式を示しています。ここで、著者は B、C、D を 0、1、2 として表しているため、(0, 3) は B3、つまり 3 枚の組み合わせを意味します。

カードの組み合わせを定義した後、現在の 14 枚のカードが勝利からどれだけ離れているかを判断するための測定方法が必要です。ここで、著者は欠陥の数を紹介しています。簡単に言えば、不足しているカードの数は、勝つために現在の手札から不足しているカードの枚数を示します。

理系の学生はカードをどのように見ているのでしょうか?

ランダムな 14 枚のカードのハンドにおけるカードの表現と不足しているカードの数を定義したら、次に必要なのは、現在のカードの品質を評価し、カードをプレイして不足しているカードの数を 0 に減らす方法を知ることだけです。まず、14 枚のカードの手札の場合、不足しているカードの数は 3 枚以下です。論文の第 3 章では、主にこの点について議論し、証明します。

純粋なカードのスートの場合、不足しているカードの数は、次の場合にのみ 3 になります。

通常のカードの場合、不足するカードの上限は 6 枚です。論文の第 4 章では、主にこの点について議論し、証明します。

これで、不足しているカードの数の定義と証明に基づいて、現在のハンドの質を測定できるようになりました。まず、カードがなくなった後の完全なハンドを定義し、次にカードがなくなったことと勝利との間のコストを計算する必要があります。

ここで例を挙げてみましょう。 引いた 14 枚のカードが次のとおりである場合: T = (B1B1B2B2B2B2B3B3)(C1C2C8)(D2D2D8)、ここで C2 は 2 万を表します。 p 分解は次のように表現できます。

π_0 にはすでに 4 枚の B2 カードがあるため、π_0 の (B1 B3) はシーケンスを形成できません。 π_1 と π_2 は両方とも飽和しており、完全に組み合わせることができます。たとえば、π_1 の欠けているカードは次のとおりです。

そのコストはコスト(π_1) = 4です。理想的なコストを決定した後、理想的な戦略を見つけて、最小のラウンド数でコストまたは不足しているカードの数を 0 に減らす必要があります。もちろん、カードをプレイするプロセスをモデル化し、理想的な戦略を見つけるには、さらなる研究が必要です。

結論と考察

本論文では、著者は麻雀に関する数学的および AI 的研究を開始しました。本稿では、麻雀をプレイするためのコンピュータ プログラムを設計するにあたり、まず、不足カードの枚数の定義、知識ベースの概念、およびステップ k 値が重要な役割を果たすことについて説明します。

麻雀は非常に人気のあるゲームですが、麻雀を専門に研究した数学や AI の論文はほとんどありません。私たちの知る限り、数学的手法(主に基礎的な組合せ理論)を用いて麻雀を真剣に研究した論文は、Yuan Chengらの論文[4]のみである。その論文では、著者らは麻雀における特別な組み合わせ問題、すなわち k ゲート問題を研究しました。

純粋な 13 枚のカードのハンド T は 9 ゲートと呼ばれ、同じ種類の任意のカードを T に追加して勝つことができます。 1 ≤ k ≤ 9 の場合、異なる値のカードが K 枚あり、これらの k 枚のカードのみが T を完了できる場合、T は k ゲート問題と呼ぶことができます。この論文で構築された形式表現を使用して k ゲート問題を記述できることは容易にわかります。すべての k ゲートを見つけるには、T を i に追加することで完成するカードがちょうど k 枚あるかどうかに関係なく、13 枚のカードのセットごとに決定を下すだけで済みます。

上記の研究を拡張できる方向は少なくとも 3 つあります。まず、M_0 に、東、南、西、北などの風カード、赤中心、運勢、白板などの矢印カード、花カードなど、より多くのカードを含めることができます。次に、7 ペアを許可したり、少なくとも 2 つのスーツを要求するなど、14 枚のカードのハンド ルールを増減できます。 3 番目に、14 枚のカードのハンドはそれぞれ異なるスコアを持つ場合があります。たとえば、純粋なスーツのスコアはランダムなハンドよりも高くなります。将来の研究ではこれらの問題に対処しようとする可能性があります。

論文:麻雀をやろう!

論文アドレス: https://arxiv.org/pdf/1903.03294.pdf

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  ブロックチェーンと人工知能、統合開発の「win-winゲーム」

>>:  ガートナー: 人工知能に関するよくある誤解5つ

ブログ    
ブログ    

推薦する

二足歩行ロボット「キャシー」が機械学習を使って5kmのジョギングを完走

ロボット工学の世界では 4 年というのは長い期間ですが、特にオレゴン州立大学 (OSU) が開発した...

オックスフォード大学の最新調査:AIはベンチマーク危機に直面し、NLPは推論テストの「取り組み」に注力

人工知能 (AI) ベンチマークは、モデルを測定および比較するための方法を提供します。ベンチマークを...

ニューラル ネットワークの BP アルゴリズムが発明されるまでになぜ長い時間がかかったのでしょうか?

ローズブラットは 1950 年代にパーセプトロンを提案し、多層ニューラル ネットワークの BP アル...

TensorFlow から Theano まで: 7 つのディープラーニング フレームワークの水平比較

[[183874]]ディープラーニング プロジェクトを開始する前に、適切なフレームワークを選択するこ...

...

...

人工知能がスマートホームに加わり、未来が現実になる

[[262824]]スマートシティ建設が国家戦略となり、ハイテクが急速に発展するにつれて、スマートシ...

感じてください:XiaoIce、XiaoAi、Xiaodu、LingyuanがAIサミットのテーマソングを共同で歌いました

7月9日、 2020年世界人工知能大会クラウドサミットのテーマソング「スマートコネクテッドホーム」が...

Tian Yuandong らの新しい研究: メモリのボトルネックを突破し、4090 で 7B の大規模モデルを事前トレーニング可能に

先月、Meta FAIR の Tian Yuandong が参加した研究が大きな称賛を受けました。彼...

中国の創作力はGPT-4を超える、「最高の文章力」を持つ中国のビッグモデルWeaverが登場

ChatGPT などの一般的な大規模モデルは数百の機能をサポートしていますが、一般的な日常的なユーザ...

27,303件のホットなコメントを調べた結果、なぜ「紅炎火水」は未だに世間から嘲笑されているのか?

AI開発者会議でスピーチをしている最中に、ロビン・リーは見知らぬ人から頭に水の入ったボトルをかけら...

トポロジカルデータ分析(TDA)は、人工知能のブラックボックスを破ると期待される魔法のアルゴリズムです。

本稿では、トポロジカルデータ分析 (TDA) の基本原理を紹介し、事例を示し、この方法が視覚分析を効...

カリフォルニア大学の中国の博士研究チームは、リアルタイムの「思考から音声への変換」で鳥の鳴き声を真似るAIを訓練した。

現在の最先端の音声変換システムは、「考える」から「話す」へと進む人間の自然なプロセスと比較すると遅い...

人工知能とセキュリティ:繋がる双子

何十年もの間、セキュリティは重要であると考えられてきましたが、いわゆる「コアビジネス」機能に関与した...

...