エンドゲームゲームを使用して人工ニューラルネットワークアルゴリズムを理解する

エンドゲームゲームを使用して人工ニューラルネットワークアルゴリズムを理解する

[[431963]]

この記事はWeChatの公開アカウント「Zhibin's Python Notes」から転載したもので、著者はAn Keです。この記事を転載する場合は、Zhibin の Python Notes 公開アカウントにご連絡ください。

みなさんこんにちは、私はZhibinです〜

ジビンは今、チェスの終盤を迎えており、黒側にはキングが 1 体だけ、白側にはポーン 1 個とキング 1 体だけしか残っていない。これで、ジビンは、白がチェックして黒が勝つか、引き分けかという 2 つの結果が起こり得ることを知っています。

では結末は?次はディープラーニング人工ニューラルネットワークアルゴリズムを使って答えを出していきましょう~

1. ルールの紹介

プログラムをコンパイルする前に、チェスのルールを簡単に理解する必要があります。ルールは次のとおりです。

チェス盤のサイズは 8 x 8 で、黒と白のチェスの駒がそれぞれ 16 個あります。つまり、キング 1 個、クイーン 1 個、ルーク 2 個、ゾウ 2 個、ナイト 2 個、ポーン 8 個です。

兵士: 前進のみ可能 (中国将棋と同様に後退は不可)、一度に 1 マスしか移動できません。ただし、チェスのポーンが最初の動きをするときは、1 マスまたは 2 マス移動できます。ポーンが駒を取る方法は、移動方向によって異なります。ポーンは、まっすぐ移動して駒を取ります。つまり、ポーンの斜め前方のマスの中に相手の駒があれば、それを取ってそのマスを占領することができます。

王:水平、垂直、斜めに移動できますが、一度に移動できるのは 1 ステップだけです。しかし、中国のチェスと比較すると、王は食べ物を与えることができません。つまり、王は敵が支配するマスに入ることができません。そうでなければ、「王を送る」という反則とみなされます。合計 3 回のファウルは負けになります。

勝ち負け:相手の最高司令官である王を捕らえると勝ち、相手を動けなくすると引き分けとなります。

2. 解決策

1 トレーニングセットを読む

krkopt.data トレーニング セットを読み取ります。コードは次のとおりです。

  1.   ' krkopt.data' 'r' )をfとして開きます:
  2. 行 = f.readlines()
  3. データ = np.zeros((28056,6),dtype= float )
  4. ラベル = np.zeros((28056,2),dtype= float )

読み取り結果の表示:

上記の各データ行はトレーニング サンプルです。以下に示すように、最初のデータ行を分析の例として取り上げます。

a1、b3、c2 は 3 つのチェスの駒の座標を示します。黒のキングは図に示すように位置 a1 にあり、白のキングは図に示すように位置 b3 にあり、白のポーンは図に示すように位置 c2 にあります。この時、黒キングはもう打つ手がない状態となり、ゲームは引き分けに終わります。そのため、最終引き分けは引き分けを意味します。データの最後のラベルが 6 であると仮定すると、白は最大 6 手で黒を倒すことができることを意味します。

2 トレーニングを開始する

まず、トレーニングに必要な Python ライブラリをインストールします。

  1. pip インストール numpy
  2. pip インストール sklearn
  3. matplotlib を pip でインストールします

次に、データセット全体を 3 つの部分に分割します。コードは次のとおりです。

  1. ratioTraining = 0.4 #トレーニングデータセット 40%: トレーニングデータセットを使用してニューラルネットワークのパラメータを調整します
  2. ratioValidation = 0.1 #10% 検証データセット: 調整が適切か不適切かを検証し、プログラムを終了するかどうかを決定するために使用されます
  3. ratioTesting = 0.5 #テストデータセット50%: トレーニング後、ニューラルネットワークの全体的なトレーニング効果を測定するために使用されます

次に、Scikit-learn の Scaler クラスを使用して、平均を減算し、分散で割ることで標準を正規化します。コードは次のとおりです。

  1. スケーラー.変換(xTraining)
  2. スケーラー.変換(xTexting)
  3. スケーラー.変換(xValidation)

ニューラル ネットワークを作成します。コードは次のようになります。

その中には、layer=[6, 20, 20, 20, 2] 入力は6次元、出力は2次元、合計3層のニューラルネットワークがあり、各層には20個のニューロンがあります。

  1. active_function = 'relu'ニューラルネットワーク活性化関数
  2. learning_rate=0.01 学習率α
  3. batch_normalization=1 正規化操作
  4. objective_function = 'クロスエントロピー'目的関数

トレーニング開始後、COST 損失関数は継続的に減少しているのに対し、認識率の精度はゆっくりと増加し、1 に限りなく近づいていることがわかりました。

コードは次のとおりです。

上記の分析の結果、白が勝つ確率は非常に高く、ほぼ 1 に近いことがわかります。

3. まとめ

1. この記事では、チェスの終盤を例に、人工ニューラル ネットワーク アルゴリズムの実装方法を説明します。後でまた練習していただければ幸いです。

2. この記事は学習参考のみを目的としており、他の目的には使用できません。

コラムニスト:強化学習とマルチエージェントコラボレーションを研究している大学院生、An Ke。勉強が好き、学ぶのが大好き、共有する意欲があり、そして何よりも、彼女は美しい女性です〜

<<:  中国消費者協会:所有者や消費者は顔認識を強制されることはない。情報が漏洩すると非常に有害だからだ。

>>:  毎日のアルゴリズム: スパイラルマトリックス

ブログ    
ブログ    
ブログ    

推薦する

AlphaFold2 は大きな貢献をしました!清華大学チームがディープラーニングでCOVID-19抗体を強化し、AIの画期的な成果を生み出す

2020年末、DeepMindが開発した第2世代ディープラーニングニューラルネットワークであるAlp...

OccNeRF: LIDARデータの監視は不要

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

DeepMindがAIツールGNoMEをリリース、220万個の新しい結晶材料を発見したと主張

12月1日、GoogleのDeepMindは最近、Nature誌で自社のAIツールGNoMEを披露し...

マイクロソフトの英語音声評価機能がアメリカ英語一般版で開始され、教育業界に力を与える

発音は言語学習の重要な部分です。 Microsoft Azure Cognitive Service...

コンピュータービジョンにおける次の大きな進歩はどこから生まれるのでしょうか?

翻訳者 | ブガッティレビュー | Chonglou 1950 年代のコンピューター ビジョンの最初...

機械学習エンジニアになる方法

[[376371]] [51CTO.com クイック翻訳] 人工知能や機械学習の技術を導入する企業が...

...

スノーフレークアルゴリズムを学ぶのに役立つ記事

[[419666]]序文みなさんこんにちは、パンパンです!これまでは rand と srand を使...

ディープラーニングと通常の機械学習の違いは何ですか?

[[212077]]本質的に、ディープラーニングは、ディープニューラルネットワーク構造(多くの隠れ...

2021 年の人工知能データ収集および注釈業界の 4 つの主要トレンド予測

人工知能データ収集およびラベリングのリーディングカンパニーであるYunce Dataは最近、「202...

人工知能の発展方向と機会

[[358422]] 01 現段階における人工知能のボトルネック現在、人工知能、特にその応用分野では...

すべてがジョジョになる:このGANはマスクを人間ではないものにする

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

最高裁:コミュニティへの出入りの際の唯一の確認方法として顔認証を強制すべきではない

出典: @CCTVニュース【最高裁:顔認証は、居住コミュニティの入退出の唯一の確認方法として強制して...