意思決定インテリジェンス: 人工知能における新たな方向性

意思決定インテリジェンス: 人工知能における新たな方向性

[[353168]]

記者趙光麗

最近、中国科学院自動化研究所(以下、自動化研究所)は、「妙算智慧」戦術戦争ゲームリアルタイム戦略人機対決プラットフォームの開設を発表し、人機対決の知能化技術の研究をさらに推進することを目指しています。このプラットフォームは「預言者と軍師賢者」知能ゲーム対決シリーズに使用されており、オープンプラットフォーム、オンライン対決、技術共有などの特徴を備えていることが分かっています。

人間と機械の対決は、意思決定の知能を探求する重要な方法の 1 つとして国際的に認識されています。国の次世代人工知能の重要な発展方向として、意思決定インテリジェンスの研究開発が本格化している。同時に、意思決定インテリジェンスは複数の分野の交差点に関係するため、関連する調査にはすべての関係者の共同の取り組みが依然として必要です。

複数の分野を巻き込む

意思決定インテリジェンスをどのように定義すればよいでしょうか?最近開催された「第一回インテリジェント意思決定フォーラム」で、オートメーション研究所所長の徐波氏は、人間の知能のメカニズムに対する体系的な理解がまだ不足しているため、人工知能について、含意に基づいた学問的な定義を与えることは依然として難しいと考えている。しかし、彼は、意思決定知能は「知能は環境との相互作用から生成される」こと、そして知能は「不確実な環境を探索し発見する」能力を持つべきであることを強調していると述べた。

彼は、意思決定インテリジェンスには、不確実な環境において適切な行動、選択、決定を行えるインテリジェントエージェントが必要であると説明しました。ここでの「環境」とは、人々が人工知能を使ってよりよく理解し、探求し、モデル化し、制御しようとしている物理世界、人間社会、その他のシステムを指します。

知覚知能とは異なり、意思決定知能は主に不確実な環境の探索に基づいています。したがって、自律的な意思決定を行い、環境フィードバックの利点を最大化するために、環境情報と自身の状態を取得する必要があります。このフィードバックによって形成されるシステムの閉ループは、人工知能により完全な表現形式を与えるでしょう。

自動化研究所は、中国初の人工知能と脳科学に関する学際的な研究を実施し、中国初の人工知能大学を設立した中国初の科学研究機関です。現在、当研究所は自律進化型インテリジェンスへの投資、開発、突破に注力しており、意思決定インテリジェンスの基礎理論、アルゴリズム、環境、評価、応用に関する研究を行うために20以上のチームを組織しています。

上記フォーラムでは、欧州科学アカデミー外国人会員で北京大学先端コンピューティング研究センター教授の鄧小鉄氏、清華大学学際情報科学学院助教授の張崇傑氏、ロンドン大学ユニバーシティ・カレッジ・コンピューターサイエンス学部教授の王軍氏などの学者も、意思決定インテリジェンスの含意について議論した。学者たちは、意思決定知能は「行動主義」の色が強い一方で、「象徴主義」や「コネクショニズム」のエッセンスも吸収していると指摘している。この特性により、意思決定インテリジェンスには、コンピューター、制御、数学、認知心理学、神経科学などの多くの分野が関与することになります。

「現在、強化学習などの手法に基づく意思決定インテリジェンスは、主に『状態』から『行動』へのマッピングを学習している段階であり、説明可能で因果関係があり、インタラクティブな意思決定にはまだまだ遠い」と鄧小鉄氏は述べた。

ゲーム理論との相互作用

意思決定インテリジェンスを探求する多くの道の中で、マルチエージェントシステム(以下、マルチエージェント)は、国際的に人工知能技術の最先端の分野です。人々は、相互に通信して調整する複数のインテリジェントエージェントが協調した行動を取り、大規模で複雑な現実世界の問題を解決できることを期待しています。しかし、現時点では、強化学習に基づくマルチエージェント研究手法の多くは十分に成熟していません。

「ゲーム理論は、複数のインテリジェントエージェント間の競争を記述および分析するための最良の理論的枠組みです。」鄧小鉄氏は、ゲーム理論がマルチエージェントシステムの研究における理論的基礎の役割を果たすと考えています。同時に、人工知能の発展はゲーム理論の分野にも広範囲にわたる影響をもたらしました。

「既存のゲーム理論のアイデアを借りて強化学習法の設計を導くと、より良い結果が得られることが多い。逆に、対応する理論がなければ、研究者は『スイカの皮を踏んで、どこにでも滑っていく』という恥ずかしい状況に陥る可能性が高い」と鄧小鉄氏は述べた。マルチエージェントシステムをより良く発展させたいのであれば、対応する理論的基礎が必要であり、ゲーム理論がその役割を果たしていると述べた。

さらに、王軍氏は、機械学習システムは本質的に情報処理システムのサブセットに過ぎないと考えています。現在の機械学習は情報理論と密接に統合されており、将来的にはますます多くの情報理論が機械学習とマルチエージェントシステムに適用されるでしょう。

焦点を当てるべき

「強化学習」は、現在のインターネット経済のシナリオにおいてインテリジェントな意思決定を実現するために人々が利用したいと期待している中核的な方法の 1 つです。産業シナリオでは、現在の慣行では、まずプラットフォーム上でシミュレーションを行い、その後現実に適応させるのが一般的です。このシナリオでの強化学習は、一般的に比較的正確にシミュレートして適用できます。

しかし、サンプルの妥当性の問題に関しては、シミュレータによってシミュレートされたデータが不正確になると、データの意義は大幅に低下します。

上記のフォーラムに参加した学者らは、現在の「シミュレーション」のほとんどが機械的なシミュレーション環境のみであり、一般的に使用されているガウス過程の混合モデルシミュレーションはまだ比較的初期段階にあるためだと述べています。現在の強化学習技術は、より複雑なシナリオではうまく機能しないことが多いことがわかります。強力なシーケンス性とシンプルなアクション空間を持つシーン(NetEase Cloud、Kuaishouなどのオーディオとビデオの推奨など)のみが、より簡単に描写できます。

これはまた、コンピューター ビジョンなどの知覚インテリジェンスと比較すると、意思決定インテリジェンスの現在の応用がまだ明らかではないことを意味します。この現象に対して、会議に参加した学者たちは、仮想現実ハイブリッド、デジタルツイン、教育現場での検索推奨などのシナリオは、いずれも強化学習が応用される可能性が高い場所だと考えています。学術界は率先して産業界に参入し、研究を進めながら起業することで、産業界の変化を促進することができます。

「人工知能はまだ発展の初期段階にあり、環境に適応し、認識し、学習する能力が欠けている」。会議に参加した学者たちは、意思決定知能が人工知能の3つの流派の統合の入り口として、研究の主流になると考えている。

「意思決定インテリジェンスの基礎理論、アルゴリズム、環境、評価、応用に関する研究が本格化している。わが国は主要なニーズを満たす意思決定インテリジェンスへの投資、開発、突破に重点を置くべきだ」と徐波氏は述べた。

<<:  将来の医療における人工知能の重要な役割

>>:  人工知能が将来の経済と社会に与える影響を理解する方法

ブログ    
ブログ    

推薦する

インターネットの大失敗: 破壊された破壊者

[[324391]]インターネットの破壊的イノベーションは、自らの業界から生まれることはありません...

...

...

AIロボットが大規模に導入されると、私たちはより良くなるのでしょうか?

人工知能の波が大きな変化を引き起こすには、4年という時間は十分あります。 2016年に北京の大学の講...

天才少年が自動運転の「自転車」を製作、ネットユーザー「テスラも見たら泣くだろう」

自転車が「自力で歩ける」ようになるのはいつでしょうか? [[404743]]自転車は劣駆動システムで...

私の国の人工知能の医療応用シナリオは非常に人気があり、既存の実践では依然として3つのボトルネックを突破する必要があります。

[[261498]]私の国には1,100社以上の人工知能企業があります。人工知能の最もホットな分野...

...

...

...

Googleはディープラーニングを使ってCPUを強化することを提案:コンピューターをどんどん高速化する

アップグレードを行わないと、現代の PC は時間の経過とともに必然的に遅くなっていきます。しかし、M...

...

...

...

冷たい水の入った洗面器! FDAはロボット手術はまだそれほど信頼できないと警告

海外メディアの報道によると、ほとんどの場合、手術対象はブドウではないため、「科学者がブドウの手術を行...

...