【人工知能】人間と機械の対決知能技術の総合レビュー

[[359893]]

1 はじめに 人工知能は誕生以来、人間の知能と比較して測定されてきました（有名なチューリングテスト）。人工知能研究の最前線として、人間と機械の対決技術は国内外の人工知能研究で常にホットな話題となっています。人間と機械の対決を主な形式とする人工知能研究は、機械知能の内部成長メカニズムと主要な技術原理を探求するための優れた実験環境と検証方法を提供します。プロセス全体を通じて、機械がよりインテリジェントに人間に奉仕し、人間をいくつかの複雑なタスクから解放できるだけでなく、人間も機械知能の発展プロセスから学び、自身の知能レベルを向上させ、知能の内部本質と生成メカニズムをより深く理解して習得し、それによって情報化から知能化への社会全体の発展を促進します。

2 開発の経緯 人工知能の父であるアラン・チューリングが1936年に有名な「チューリングテスト」を提唱して以来、人間と機械の知能対決は、機械知能の発達レベルを測る最も重要な基準となっています。人工知能においては、初期の単純な知能の実現から、より複雑な知能への継続的な進化まで、コンピューティング、知覚、認知の 3 つの段階を経て対立が進行します (図 1)。ある意味では、人間と自然環境の対立が人類の進化を促進したのと同様に、機械と人間の対立も機械知能の発展と進化を促進することになります。

図1 人間とコンピュータのゲーム開発の歴史

3 意味とメカニズム 人間と機械の対峙知能技術は大きな注目を集め、さまざまな応用分野で応用の見通しを示していますが、その理論と関連技術については体系的な説明がまだありません。この記事では、その意味とメカニズムの観点から説明し、それに基づいて関連するモデルと主要な技術について説明します。

3.1 人間と機械の対決の意味

人間機械対決とは、機械と人間の対決とゲーム学習を中核技術として利用し、機械知能の急速な学習と進化を実現する研究方向です。人間と機械の対決は「チューリングテスト」の重要な手段として、機械知能を検証するための「試金石」であり、機械知能の固有の成長メカニズムを探究し、重要な技術を検証するための有効な実験環境と評価基準を提供し、重要な科学研究上の意義と応用価値を持っています。

3.2 人間と機械の対決メカニズム

人間と機械の対決メカニズムは、対決のさまざまな要素とそれらの相互関係、および相互作用の動作法則と原則を研究します。関係する要素には、人間（機械の対戦相手）、機械（対決のAI）、環境（対決のルールと条件の集合など）が含まれます。人間、機械、オブジェクトの3要素分析方法によると、3つの要素の相互作用は、それぞれ1変数ゲーム、2変数ゲーム、3変数ゲームを形成します。人間と機械の対決知能に関する科学的課題は、ゲーム学習のモデル化可能性、計算可能性、説明可能性として要約できます。

4 人間と機械の対決モデルとキーテクノロジー 知覚知能とは異なり、人間と機械の対決は通常、時間的意思決定などのより複雑な認知知能に焦点を当てています。そのプロセスのモデル化は非常に複雑な問題です。したがって、認知意思決定のモデル化は、人間と機械の対決全体の中核であり、重要なリンクです。

本論文では、強烈な対立環境における人間と機械の対立の意思決定プロセスを、知覚、推論、意思決定、制御にまとめ、人間と機械の対立の重要な技術を、対立空間の表現とモデリング、状況の評価と推論、戦略の生成と最適化、行動の調整と制御の4つの部分にまとめています。対立状況の解釈と理解、認知予測、戦略の意思決定と行動の実施を通じて、局所的および全体的に継続的に反復強化され、対立能力が自律的に向上します。人間と機械の対決に関わる主要な技術を図 2 に示します。

図2 人間とコンピュータのゲーミングのプロセスモデリングと主要技術

4.1 敵対的空間表現とモデリング

対決空間における意思決定要素の構成、属性特性、要素間の相互作用関係を正確に記述する効果的な知識表現モデルを構築することが、人間と機械の対決を実現するための基礎となります。極めて複雑で、極めて動的、かつ敵対的な環境は、大規模かつ高次元の意思決定要因、高度に結合した要因の影響、不完全な主要な意思決定情報などの特徴があり、敵対空間の定量的な表現が非常に困難になっています。この分野で考えられる研究としては、以下のものがあります。

(1) 敵対空間要素のエンティティ関係表現: 敵対空間におけるさまざまなエンティティ、エンティティ属性、およびそれらの相互作用関係を研究し、意思決定要素の表現モデルを構築します。 (2) 敵対空間の特徴テンソル表現学習: エンティティ属性関係の結合と構造トポロジーが個人およびグループの敵対能力に与える影響を分析し、敵対空間の解釈可能な高次元テンソル記述を構築します。 (3) 階層的集約アルゴリズム規則モデリング: 経験的表現と数値計算を統合し、多因子、階層的敵対状況および敵対能力集約アルゴリズム規則を定義し、環境-こちら側-敵対者の多重結合の計算可能な表現システムを形成します。 (4) 異種情報ネットワークに基づく抽象的な普遍空間表現: 能力アルゴリズム規則に基づいて敵対要素の抽象的な状況表現を研究し、敵対シナリオ依存性によって引き起こされるノイズとデータのスパース性を低減します。

4.2 敵対的状況の評価と推論

対決状況とは、対決当事者が力の比較、配置、行動を通じて形成する状態と傾向を指し、状況の評価と推論は、その後の対決戦略の生成と最適化の基礎となります。直面している課題は次のとおりです。

(1) 状況認識および予測モデルのトレーニング用の高レベルの敵対データは非常に限られていることが多い。(2) 敵対情報は乱雑で不完全な場合が多く、部分的な敵対情報のみに基づく全体的な状況評価の精度は低くなる。(3) 複雑な敵対環境では、状況評価に利用できる情報が大量に発生するが、これを効果的に統合して多角的で階層的な状況を形成することは困難である。実施できる研究には、(1) 高品質敵対データの生成、これは自律ゲームや生成的敵対ネットワークなどの方法を通じて、人間と機械の敵対モデリングと分析のための高品質人間と機械の敵対データを生成することです。(2) 小サンプル学習、これはデータが少ない場合に、移行や適応などの方法を通じて敵対状況の直接評価を研究することです。(3) 敵情報推定、これは履歴情報と現在の敵対環境の組み合わせを研究して、下から上への敵の行動推定、意図認識、戦略推定を実現することです。(4) 状況階層的認識、これは複数のソースの異種情報を組み合わせることで、状況の多角的な階層的評価と推論を研究することです。

4.3 対策戦略の生成と最適化

対決戦略は、主にマルチエージェントコラボレーションのためのタスク計画を伴い、グループおよび個人の行動計画問題を解決します。技術的な課題は次のとおりです。

（1）不完全情報とは、対戦相手の位置、行動、意図を完全に知ることができないことを意味する。対戦相手の行動の未知の確率モデルは保守的な戦略選択につながり、不完全情報の下でゲーム戦略を選択する必要がある。（2）マクロ決定の利益のフィードバックは遅れるため、マクロ決定の効果が現れるまでに長い時間が必要になり、意思決定行動と利益の間に効果的なマッピングを形成することが困難になる。（3）行動能力は環境と深く結びついている。ローカルな環境要因を無視すると、戦略分析に重大な逸脱が生じる可能性があり、過度に詳細な分析は対決空間の縮小を困難にする。戦略の生成と最適化の課題に対応するために、StarCraft などの戦略ゲームを研究のプラットフォームとして使用することは、国際的に認められたアプローチです。実施できる研究には、(1)マクロ戦略生成、ミッションタスクに直面するグローバルゲーム対決問題に対して、階層的なタスク分解とタスク調整メカニズムを構築し、複雑なグループゲーム対決問題を低次元空間に縮小する、(2)ミクロ戦略生成、ローカルゲーム対決問題に対して、マイクログループのローカル戦略適応メカニズムを構築し、マイクログループの強力なゲーム対決能力と環境移行能力を実現する、(3)戦略最適化方法などが含まれる。戦略能力を自律的に向上させる必要がある問題に対して、ゲーム戦略評価メカニズムと学習ベースの戦略進化メカニズムを構築し、ゲーム戦略の自律的進化と能力向上を実現する。

4.4 敵対行為の調整と制御

戦略を実行するには、複数のインテリジェントエージェントの協調行動が必要です。各インテリジェントエージェントは、独自の情報取得と予備認識に基づいて、リソース貢献、情報接続、要素融合、仮想コラボレーション、インテリジェント支援などの機能を使用して、複数のユニットを仮想的に調整し、統合されたグループアクション調整と制御を形成します。マルチエージェントコラボレーションの難しさとしては、マルチエージェントの学習目標、個人報酬とチーム報酬の関係、学習プロセスにおけるエージェント間の役割と影響、共同状態と共同行動の獲得、状態空間と行動空間の拡大によって引き起こされる次元の呪いなどが挙げられます。

現在、関連する研究作業は主にマルチエージェントのコラボレーションと学習に焦点を当てています。考えられる研究には以下が含まれます。

（1）コラボレーションプロセスの観点から、シーケンシャル戦略表現、コラボレーションメカニズムの最適化、異種マルチエージェントコラボレーション、および複数のコラボレーションの融合に分けられます。（2）コラボレーションタスクタイプの観点から、同じタスクの協力的なインテリジェントコラボレーション、異なるタスクのリソース調整などに分けられます。（3）理論的には、分散化と通信中断の暗黙のコラボレーション方式を打破します。タスクは、シリアル化タスク、マルチレベルタスク、マルチフィールドタスクなどをカバーし、シナリオタイプと多様なコラボレーション方法を完全にカバーし、トレーニング用の高品質のコラボレーション戦略を提供します。

5 つのアプリケーションと課題 人間と機械の対決知能技術の応用分野には、チェスやカードゲーム、リアルタイム戦略ゲーム、ウォーチェスシミュレーションなどが含まれます。多くの分野で、機械知能はその分野のトップクラスの人間プレイヤーに到達し、それを上回り、ゲーム対決の記録を絶えず破り、認知意思決定における新しいラウンドの人工知能技術の際立った特徴を示しています。

5.1 ボードゲーム戦略コンテスト

ボードゲームや戦略ゲームは、コンピューターの知能開発レベルをテストするための基準として長い間使用されてきました。これらのゲームは、そのシンプルなルールと豊富なゲームプレイにより、世界中のファンに愛されています。また、そのルールの決定論性とゲーム環境の制御可能性、および不完全な情報により、人工知能の分野で継続的な研究が行われています。

[[359894]]
DeepMindのAlphaGoテクノロジーが人間と機械の囲碁ゲームに勝利

[[359895]]

1対1のノーリミットテキサスホールデムでは、
DeepStack はプロのプレイヤーに勝利した初のテキサスホールデム AI プログラムとなりました。
カーネギーメロン大学の研究者らが提案したLibratusというテキサスホールデムAIアルゴリズムも、数人のトッププロのテキサスホールデムプレイヤーを破った。

5.2 リアルタイム戦略ゲーム対決

リアルタイム戦略ゲームは、機械知能を評価するためによく使用されるもう 1 つのプラットフォームです。ボードゲームと比較すると、対決プロセス全体がリアルタイムで行われます。通常、このタイプのゲームには、リソースの収集、基地の建設、テクノロジーの開発など、いくつかの要素が含まれます。ゲーマーは、さまざまな要素のバランスを取り、1 つまたは複数の制御ユニットを制御して対決を完了する必要があります。古典的なリアルタイムストラテジーゲームには、StarCraft や Dota2 などがあります。国際的な AI コンテストや企業と学界の友好的な協力のおかげで、リアルタイム戦略ゲーム AI は大きな進歩を遂げました。

[[359896]]
スタークラフトのAIプログラム「アルファスター」が人間のプロプレイヤーに10対1で勝利

関連する AI アルゴリズムには、制御対象ユニット間のマイクロ操作のマルチエージェント強化学習ベースの制御、ディープニューラルネットワークモデルベースのマクロ戦闘意思決定、および対決プロセスのステートマシンモデルベースの進化が含まれます。深層強化学習技術は多くのゲームで優れたパフォーマンスを発揮していますが、トップクラスの人間プレイヤーに勝つためにモデルの安定性とパフォーマンスを向上させる方法、そして信頼できる学習モデリングをサポートするためにモデルを解釈可能にする方法には、AI アルゴリズムの継続的な進歩が依然として必要です。

5.3 軍事シミュレーションと対決

軍事シミュレーションと推論は、その戦略的意義から長い間国民の注目を集めており、その対決演習は重要な実用価値を持っています。ゲーム対決の規模の拡大に伴い、対決空間は指数関数的な成長を示し、多軍協調と環境結合の問題が顕著になっています。戦争システムは、強い非線形性と高いダイナミクスなどの複雑な特性を持ち、分析計算と最適戦略のランダム近似はどちらも大きな課題です。人間と機械の対決では、対戦相手の行動認識モデルと共進化ゲーム戦略を開発し、対決能力を継続的に向上させる必要があります。

[[359897]]
空中戦闘インテリジェントゲーム人間機械対決システム（ALPHA）は、無人機と有人機の戦闘の序章を開いた。

[[359898]]
オートメーション研究所が開発したCASIA Prophet 1.0システムが戦争ゲームコンテストで優勝

実際、ゲームは人類社会のあらゆる側面に浸透しています。ゲームと対決は政治、経済、文化、軍事などの面で重要な役割を果たしています。人間とコンピューターの対決技術は、情報の取得、伝達、分析、理解、推論、意思決定などのリンクにも役割を果たし、知覚と認知知能の発達を促進します。

要約と展望 人工知能、特に機械学習と脳型コンピューティングの発展は、人間と機械の対立知能と自律進化にチャンスをもたらしました。人間と機械の対立問題の本質に対する理解と分析を深め、機械知能と人間の知能の効率的な協力メカニズムを科学的かつ合理的に確立し、人間と機械の対立の理論、技術、応用において大きな進歩を達成し、経済、政治、金融、人類社会の生活など多くの分野で知能化プロセスを促進することが急務となっています。

<<: 特徴検出器からビジュアルトランスフォーマーへ: これは畳み込みニューラルネットワーク時代の終焉か?

>>: 人工知能の時代が到来し、教育は大きく変わるかもしれません。未来の教育は人工知能をベースにしたものになるのでしょうか？