深い知識の 6 つの次元: 人工知能に世界を真に理解させるにはどうすればよいでしょうか?

どのような知識が私たちを賢くするのでしょうか?私たちが世界を理解し、新しい経験を解釈し、思慮深い選択をするために使用する認知構造とは何でしょうか?人間や人工知能に深い理解と高度な認知を与える知識を明確に表現するためのフレームワークを定義することは、このトピックについて構造化された議論を行うのに役立ちます。

最近、インテルラボの副社長兼新興AI研究ディレクターのガディ・シンガー氏は、人工知能に高度な認知能力を与える知識構造のいくつかの次元を紹介し、よりインテリジェントなマシンへの道を示しました。

インテルラボ副社長ガディ・シンガー

高レベルの機械知能の中核は、知識構築によって人工知能システムが独自の世界観を整理し、人工知能に意味、イベント、タスクを理解する能力を与えることを可能にすることであると考えられます。このようにして、機械の認知は、データから、記述的知識、世界の動的モデル、起源などの次元を含む知識構造へと拡大します。

言語を学ぶときは、形式と意味を区別する必要があります。形式とは、意味を表現するために使用される記号、つまり表面的な表現を指します。各フォームは特定のコンテキストで特定の意味を持ち、フォームは異なるコンテキストで異なる意味を持つ場合があります。

Bengio 氏と Schölkopf 氏らは「因果表現学習に向けて」で次のようにまとめています。「機械学習における現在の成功のほとんどは、適切に収集された独立かつ同一に分布する (iid) データに対する大規模なパターン認識から生まれています。」これらのシステムは、テキスト文字、音声信号、画像ピクセルなどの観測可能な要素を取り込み、パターンとランダムな相関関係を確立して、認識ベースのタスクで優れた結果を生み出します。

論文アドレス: https://arxiv.org/pdf/2102.11107.pdf

アルゴリズムは表面的な相関関係を超えて真の理解のレベルにまで進み、より高いレベルの機械知能を実現する必要があるというコンセンサスが高まっています。この根本的な変化により、システム 2、第 3 波、または汎用/柔軟な AI と呼ばれるものが実現します。 Gadi Singer 氏が Core ブログ「認知 AI の台頭」で主張しているように、より高度な機械知能には、AI を表面的な関連性から世界の真の理解へと移行させるような深い知識の構築が必要です。

米国防総省国防高等研究計画局（DARPA）のジョン・ローンチベリー氏は、人工知能の第3の波では、抽象化（新しい意味の創造など）と推論（計画や意思決定）が新たな革命を起こすだろうと指摘した。第 3 の波自体は、コンテキスト適応を特徴としています。つまり、システムは現実世界のさまざまな現象についてコンテキスト説明モデルを構築します。

知識次元には、世界観を反映する 2 つの次元があります。1 つは、世界に存在する物事を概念的に抽象化する記述次元であり、もう 1 つは、現実世界とその現象の動的モデルです。

さらに、物語は、共通の信念や神話に基づいた複雑な物語を理解し、伝える人間の能力を高めます。コンテキストとソースの帰属、および価値と優先順位は、条件に基づく妥当性と知識の継続的な重ね合わせをもたらすメタ知識の次元です。最後に、概念的参照は、次元、様相、参照にわたって存在する構造的基盤です。

これら 6 つの知識次元を組み合わせることで、AI は単なるイベントの相関関係を超えて、より深い理解を得ることができます。これは、これら 6 つの知識次元の根底にある概念が永続的であり、過去および将来のイベントを説明および予測し、計画および介入を可能にし、反事実的現実を考慮することもできるためです。これが、この記事で使用されている「ディープナレッジ」という用語の由来です。

機械知能に必要な知識構築の種類を明確にし、説明することは、この知識構築を達成するための最善の方法を決定するのに役立ち、それによって機械知能のより高いレベルを達成することができます。

1 より高度な知能を支える6つの知識次元

AI システムの場合、人間の理解とコミュニケーションで観察される知識構築を実装することで、知能に大きな価値をもたらすことができます。すべての知識タイプがサポートされ、組み合わせられると、実際の価値は劇的に増加します。

キャプション: より高度な知能をサポートする知識の次元。画像提供: Gadi Singer/Intel Labs

（１）記述的知識：階層、分類、属性継承

記述的知識（概念的知識、命題的知識、宣言的知識）は、事物、出来事、事物/出来事の特性、およびそれらの関係を記述します。深い記述的知識は、クラスまたは概念の（適切な）階層が使用される限り、元の定義を拡張できます。このタイプの知識には、事実や記録システムが含まれます。特定のユースケースや環境に関連する事実や情報を、階層的な知識として整理、活用、更新できます。

単一の AI システムで使用される基本オントロジーには、キュレーションされたシステム (OpenCyc オントロジーや AMR 名前付きエンティティタイプなど) からのタスク関連のクラスとエンティティをシードできます。この基本的なオントロジーは、ニューラルネットワーク/機械学習技術を通じて拡張可能である必要があります。つまり、新しい知識を獲得すると、新しいエンティティ、関係、クラスが生成されます。

（２）世界モデル

世界における現象のモデルにより、AI システムは状況を理解し、入力/イベントを解釈し、将来の潜在的な結果を予測して行動を起こすことができます。現象モデルは、形式モデルと近似（非形式）現実世界モデルに分けられる抽象化/一般化です。現象モデルでは、変数と特定の状況のインスタンスへの適用が可能で、特定のインスタンスまたはより一般的なクラスの記号操作が可能になります。

形式モデルの例としては、論理、数学/代数、物理学などが挙げられます。形式モデルと比較すると、現実世界のモデルは経験的、実験的であることが多く、時には乱雑ですらあります。現実世界のモデルには、物理モデル、心理モデル、社会モデルなどがあります。プログラムモデル (「独自の知識」) はこのクラスに含まれます。

因果モデルは、人工知能システムを次のレベルに引き上げるのに役立ちます。状況が変化すると、因果関係、原因を制御する状況の理解、反事実を考慮する能力などの知識モデルと組み合わせることで、過去の統計を現在に効果的に適用して将来を予測することができます。これらのモデルは、条件や考えられる要因の観点から状況やイベントを理解するのに役立ちます。因果推論は人間の思考の不可欠な部分であり、これを通じて人間レベルの機械知能を実現することができます。

（３）ストーリーと脚本

歴史家ユヴァル・ハラリが主張しているように、物語は個人や社会の文化や世界観の重要な部分を形成します。人間の行動やコミュニケーションを完全に理解し説明するには、ストーリーの概念が必要です。ストーリーは複雑であり、1 つの一貫した物語の中に複数のイベントやさまざまな情報が含まれる場合があります。ストーリーは単なる事実や出来事の集まりではありません。ストーリーには、提示されたデータを超えた理解と一般化を促進する重要な情報が含まれています。世界モデルとは異なり、物語は歴史的、参照的、または精神的な重要性を持つものとして考えることができます。物語は人々の信念や行動に影響を与える価値観や経験を表すことができます。例としては、宗教的または国家的な物語、神話、あらゆるレベルの人々の間で共有されている物語などが挙げられます。

（４）文脈と情報源の帰属

コンテキストは、イベントを取り囲み、イベントの自己一貫性のためのリソースを提供するフレームワークとして定義されます。コンテキストは、そこに含まれる知識を規制する上位の知識構造として考えることができます。コンテキストは永続的なものでも一時的なものでもかまいません。

永続的なコンテキストは長期にわたる場合（西洋または東洋の哲学的観点から獲得された知識など）、または新しい学習教材に応じて時間の経過とともに変化する場合もあります。永続コンテキストはタスクごとに変更されません。
一時的なコンテキストは、特定のローカルコンテキストが重要な場合に関連します。単語は、周囲の文または段落のローカルコンテキストに基づいて解釈されます。画像内の関心領域は、多くの場合、画像またはビデオ全体のコンテキストで解釈されます。

永続的なコンテキストと一時的なコンテキストを組み合わせることで、知識を解釈および操作するための完全なセットアップを提供できます。

知識のもう 1 つの関連する側面は、データの出所 (別名、データの追跡可能性) です。これには、データの出所、移動中に何が起こったか、時間の経過とともにどこに移動したかが含まれます。人工知能システムは、特に「ポスト真実の時代」と呼ばれる時代には、受け取った情報がすべて正しい、または信頼できると想定することはできません。信頼性、認証、追跡可能性を確立するには、情報とそのソースを関連付けることが必要になる場合があります。

（５）価値観と優先順位（善悪と倫理を含む）

知識のあらゆる側面（オブジェクト、概念、手順など）には、最大の善から最大の悪に至るまで、判断の全範囲にわたって対応する値があります。人間の知能の進化には、報酬の追求とリスクの回避（例：昼食を食べようとする、昼食として食べられるのを避ける）が関わっていると仮定することができます。このリスクと報酬の関係は知識と密接に結びついています。潜在的な利益と損失には実用的な価値があります。また、実体または潜在的な将来の状態には倫理に基づく価値があります。この倫理に基づく価値は、「善良さ」が潜在的な具体的な報酬や脅威に基づくのではなく、何が正しいかという根底にある信念に基づく道徳的価値体系を反映しています。

価値観と優先順位は、知識、行動、結果の関連する側面についての AI システムの主観的な判断を反映するメタ知識です。これは説明責任の基盤となるものであり、特定の AI システムの責任者はこれに注意深く対処する必要があります。 AI システムが人間と対話し、人間の幸福に影響を与える選択を行う場合、その基礎となる価値観と優先順位のシステムが重要になります。

6. 概念参照: 曖昧さの解消、統一、クロスモダリティ

知識は概念に基づいています。たとえば、「犬」は抽象的な概念です。つまり、複数の名前（犬は言語ごとに呼び方が異なります）、いくつかの視覚的特徴、音の関連性などを持つ概念です。しかし、その形態や用途にかかわらず、「犬」という概念は独特です。「犬」の概念は、英語の単語「dog」とフランス語の単語「chien」にマッピングされます。「犬」の視覚的な特徴は次のようになります。

同時に、「犬」は吠える音にも相当します。

概念参照 (略して ConceptRef) は、特定の概念に関連するすべてのものへの識別子と参照のセットです。概念参照自体には実際には知識は含まれません。知識は、前に紹介した次元に存在します。概念参照は、概念のすべての表現を統合するため、多次元知識ベース (KB) の鍵となります。

Wikidata は、構造化されたデータを集中的に保存する多次元知識ベースの良い例です。 Wikidata では、項目はトピック、概念、オブジェクトなど、人間の知識のすべてを表します。 Wikidata エントリは、このフレームワークの ConceptRefs の定義に似ていますが、重要な違いが 1 つあります。Wikidata では、「エントリ」という用語は、特定の識別子と識別子に関する情報の両方を指しますが、ConceptRefs は KB へのポインターを持つ単なる識別子です。概念に関する情報は、前のセクションで説明したさまざまなビューに入力されます (例: 概念に関連付けられた記述的知識または手順的知識)。

常識

常識的知識は暗黙の情報で構成されており、人間が世界を理解するために自動的に使用する、広く普及した（そして広く共有された）暗黙の仮定を指します。人工知能が世界をより深く理解したいのであれば、常識を文脈に適用することが不可欠です。このフレームワークでは、常識的な知識は上記の 6 つの知識タイプのサブセットと見なされます。

2 理解と知識タイプの関係

理解は知性の基礎です。より高度な機械知能への移行により、「理解」についての議論が巻き起こっています。ジョシュア・ベンジオ氏は、人間のような理解力を持つ AI を次のように説明しています。

原因と結果、そして世界の仕組みを理解する。
抽象的な行動を理解する;
新しい状況でも、この知識を活用して制御、推論、計画する方法を知る。
何が起こったのか説明してください。
流通外（OOD）生成。

知識中心の理解の定義は、豊富な知識表現で世界観を創造する能力、この世界観を強化するために新しい情報を取得して解釈する能力、既存の知識と新しい情報を効果的に推論、決定、説明する能力です。

この理解の見方は、次の 4 つの機能を前提としています。

幅広い知識を有する。
新しい知識を獲得する;
エンティティと関係性にわたって知識インスタンスを接続する機能。
知識についての推論。

理解は二元的な属性ではなく、種類や程度が異なります。この視点の中心となるのは、知識とその表現の本質、つまり理解力と推論力の急速な発達を促す知識構造とモデルの表現力です。

全ての人々（と機械）を想像してみて

アルバート・アインシュタインは「知性の真の証は知識ではなく想像力である」と述べました。機械知能が真に理解されるためには、データ、事実、物語を超える必要があります。観察可能な特性や出来事の背後にある宇宙のモデルを再構築、発見、作成するには想像力が必要です。 AI システムの観点から見ると、想像力は創造的推論、つまり帰納的推論、演繹的推論、または仮説的推論を実行し、過去の経験や入出力の相関関係によって厳密に規定されていない新しい結果を生み出すことによって実現されます。

知識表現と推論は、コンピュータシステムが複雑なタスクを解決できるように、世界に関する情報の表現を扱う人工知能の成熟した領域です。知識と推論は必ずしも区別されるものではなく、既知から推測までの範囲を表します。機械理解は、高度で関連性のある推論（確率的かつもっともらしい推論、帰納的推論、類推的推論、デフォルト推論など）によって補完された知識を構築する能力を通じて実現されます。

深い知識に基づいて構築されたニューラルシンボリックAI

AI をより効果的、責任感があり、効率的に人々をサポートするプロセスにおいて、私たちの目標は、AI を認知と理解の新たなレベルに押し上げながら、AI システムをさらに強力にすることです。科学者はデータの処理、パターンの特定、一時的な相関関係の発見において大きな進歩を遂げてきましたが、どのような種類の知識が AI システムに世界をモデル化して理解する能力を与えるかについてはまだ考える必要があります。

AI がより高いレベルの認知を達成するために必要な知識構造の種類について理解が深まるにつれて、この深い知識を基に機械が世界を真に理解できるようにすることができます。

<<: Nature Sub-Journal | NUS と ByteDance が初めて AI メタ学習を脳画像に導入

>>: DeepMindがMuJoCoをオープンソース化！メタは「スケルトンハンド」にクルミをプレイさせるために使用されます