エンドゲームゲームを使用して人工ニューラルネットワークアルゴリズムを理解する

[[431963]]

この記事はWeChatの公開アカウント「Zhibin's Python Notes」から転載したもので、著者はAn Keです。この記事を転載する場合は、Zhibin の Python Notes 公開アカウントにご連絡ください。

みなさんこんにちは、私はZhibinです〜

ジビンは今、チェスの終盤を迎えており、黒側にはキングが 1 体だけ、白側にはポーン 1 個とキング 1 体だけしか残っていない。これで、ジビンは、白がチェックして黒が勝つか、引き分けかという 2 つの結果が起こり得ることを知っています。

では結末は？次はディープラーニング人工ニューラルネットワークアルゴリズムを使って答えを出していきましょう～

1. ルールの紹介

プログラムをコンパイルする前に、チェスのルールを簡単に理解する必要があります。ルールは次のとおりです。

チェス盤のサイズは 8 x 8 で、黒と白のチェスの駒がそれぞれ 16 個あります。つまり、キング 1 個、クイーン 1 個、ルーク 2 個、ゾウ 2 個、ナイト 2 個、ポーン 8 個です。

兵士: 前進のみ可能 (中国将棋と同様に後退は不可)、一度に 1 マスしか移動できません。ただし、チェスのポーンが最初の動きをするときは、1 マスまたは 2 マス移動できます。ポーンが駒を取る方法は、移動方向によって異なります。ポーンは、まっすぐ移動して駒を取ります。つまり、ポーンの斜め前方のマスの中に相手の駒があれば、それを取ってそのマスを占領することができます。

王：水平、垂直、斜めに移動できますが、一度に移動できるのは 1 ステップだけです。しかし、中国のチェスと比較すると、王は食べ物を与えることができません。つまり、王は敵が支配するマスに入ることができません。そうでなければ、「王を送る」という反則とみなされます。合計 3 回のファウルは負けになります。

勝ち負け：相手の最高司令官である王を捕らえると勝ち、相手を動けなくすると引き分けとなります。

2. 解決策

1 トレーニングセットを読む

krkopt.data トレーニングセットを読み取ります。コードは次のとおりです。

と  ' krkopt.data' 、 'r' )をfとして開きます:
    行 = f.readlines()
    データ = np.zeros((28056,6),dtype= float )
    ラベル = np.zeros((28056,2),dtype= float )

読み取り結果の表示:

上記の各データ行はトレーニングサンプルです。以下に示すように、最初のデータ行を分析の例として取り上げます。

a1、b3、c2 は 3 つのチェスの駒の座標を示します。黒のキングは図に示すように位置 a1 にあり、白のキングは図に示すように位置 b3 にあり、白のポーンは図に示すように位置 c2 にあります。この時、黒キングはもう打つ手がない状態となり、ゲームは引き分けに終わります。そのため、最終引き分けは引き分けを意味します。データの最後のラベルが 6 であると仮定すると、白は最大 6 手で黒を倒すことができることを意味します。

2 トレーニングを開始する

まず、トレーニングに必要な Python ライブラリをインストールします。

 pip インストール numpy
 pip インストール sklearn
 matplotlib を pip でインストールします

次に、データセット全体を 3 つの部分に分割します。コードは次のとおりです。

 ratioTraining = 0.4 #トレーニングデータセット 40%: トレーニングデータセットを使用してニューラルネットワークのパラメータを調整します
ratioValidation = 0.1 #10% 検証データセット: 調整が適切か不適切かを検証し、プログラムを終了するかどうかを決定するために使用されます
ratioTesting = 0.5 #テストデータセット50%: トレーニング後、ニューラルネットワークの全体的なトレーニング効果を測定するために使用されます

次に、Scikit-learn の Scaler クラスを使用して、平均を減算し、分散で割ることで標準を正規化します。コードは次のとおりです。

スケーラー.変換(xTraining)
スケーラー.変換(xTexting)
スケーラー.変換(xValidation)

ニューラルネットワークを作成します。コードは次のようになります。

その中には、layer=[6, 20, 20, 20, 2] 入力は6次元、出力は2次元、合計3層のニューラルネットワークがあり、各層には20個のニューロンがあります。

 active_function = 'relu'ニューラルネットワーク活性化関数
learning_rate=0.01 学習率α
 batch_normalization=1 正規化操作
objective_function = 'クロスエントロピー'目的関数

トレーニング開始後、COST 損失関数は継続的に減少しているのに対し、認識率の精度はゆっくりと増加し、1 に限りなく近づいていることがわかりました。

コードは次のとおりです。

上記の分析の結果、白が勝つ確率は非常に高く、ほぼ 1 に近いことがわかります。

3. まとめ

1. この記事では、チェスの終盤を例に、人工ニューラルネットワークアルゴリズムの実装方法を説明します。後でまた練習していただければ幸いです。

2. この記事は学習参考のみを目的としており、他の目的には使用できません。

コラムニスト：強化学習とマルチエージェントコラボレーションを研究している大学院生、An Ke。勉強が好き、学ぶのが大好き、共有する意欲があり、そして何よりも、彼女は美しい女性です〜

<<: 中国消費者協会：所有者や消費者は顔認識を強制されることはない。情報が漏洩すると非常に有害だからだ。

>>: 毎日のアルゴリズム: スパイラルマトリックス

シテチがスマートシティ建設に新たな活力を注入

ブログ

【WOT2018】4人の重鎮専門家が企業ビジネスにおけるNLPの詳細な応用を分析

エンドゲームゲームを使用して人工ニューラルネットワークアルゴリズムを理解する

1. ルールの紹介

2. 解決策

3. まとめ

シテチがスマートシティ建設に新たな活力を注入

【WOT2018】4人の重鎮専門家が企業ビジネスにおけるNLPの詳細な応用を分析

アメリカ心理学会：AIと頻繁に接触する従業員は孤独になりやすく、病気のリスクも高まる

Weibo での PageRank アルゴリズムの適用

世界ロボット会議は、未来がここにあることを伝えます。

機械学習により、脳とコンピューターのインターフェースが「プラグアンドプレイ」になります。 Natureサブジャーナル：麻痺患者もカーソルを制御できる

人工知能による植毛が「ネットセレブ」に？ロビン・リー：AIはクールという段階を過ぎた

推薦する

Java から MySQL に接続するためのベストプラクティスを解読: 自分に合った方法を選択する

人工知能は再び「冬」を迎えている

データ分析とAIのミスが原因の注目度の高い事件9件

崑崙Core2が量産開始：性能が2～3倍向上し、中国の産業知能に強力な「コア」を注入

PillarNeSt: Pillar ベースの 3D オブジェクト検出のパフォーマンスをさらに向上させるにはどうすればよいでしょうか?

AI時代におけるコンピュータのマクロ的な意義について語る

世界を変えた10人のアルゴリズムマスター

先ほど、Manus Lianchuang は「サンドボックス脱獄」の問題に反応し、次のように述べました。「MCP は役に立たない!」さて、オープンソース化計画が正式に発表されました！

OpenAIの仮説が覆される！計算量を考慮すると、小さいモデルの方が大きいモデルよりも優れています。Llama 2 のトレーニングは GPU コンピューティングに関連しています。

競争相手に差をつけるための機械学習プロジェクトのアイデア 8 つ

データサイエンティストが知っておくべき 5 つのグラフアルゴリズム

あなたが書いた ML コードはどれくらいのメモリを占有しますか?これはとても重要なことですが、多くの人がまだそれを理解していません。

その場所を爆破しろ！ディープマインドによる汎用人工知能の新たなブレークスルー：重みのセットが視覚テキストと意思決定をカバー