認知AIの台頭:2025年にAIは質的に飛躍する

認知AIの台頭:2025年にAIは質的に飛躍する

[[441939]]

AIの概念が初めて提唱されたのは1956年なので、60年以上の歴史があります。現在、関連する理論と技術の継続的な革新により、AIはデータ、コンピューティング能力、アルゴリズムの「3つの要素」のサポートにより、ますます私たちの日常生活に入り込んでいます。

しかし、この一連の驚きの背後には、ほとんどの AI が言語理解、視覚シーン理解、意思決定分析などで苦戦しているという事実があります。これらの技術は依然として主に知覚レベルに焦点を当てており、つまり AI を使用して人間の聴覚、視覚、その他の知覚能力をシミュレートしていますが、推論、計画、関連付け、作成などの複雑な認知インテリジェンスタスクを解決できません。

現在のAIは、情報が「脳」に入った後の処理、理解、思考が欠けており、比較的単純な比較と認識しか行わず、「認知」ではなく「知覚」の段階にとどまっています。知覚知能技術に基づくAIは、人間の知能にはまだまだ遠いものです。

その理由は、AI が、大規模な常識的な知識ベースと認知に基づく論理的推論という、その発展を制限するボトルネック問題に直面しているためです。ナレッジグラフ、認知推論、論理表現に基づく認知グラフは、国内外の学者や業界リーダーの間で「現在この技術的ボトルネックを打破できる実現可能なソリューションの 1 つ」と見なされるようになっています。

最近、Intel Labs の副社長であり、AI 分野の世界的な思想的リーダーおよび影響力を持つ 50 人の 1 人である Gadi Singer 氏が、「認知 AI の台頭」と題する記事を公開し、人工知能の第 3 の波である認知人工知能の台頭について論じました。

Academic Headlines は、原文論文の主旨を変えずに、丁寧に記事をまとめており、その内容は以下のとおりです。

ディープラーニング (DL) は驚異的な進歩を遂げており、医療、小売、製造、自律走行車、セキュリティと詐欺防止、データ分析など、私たちの生活のあらゆる側面で業界全体に革命をもたらしています。しかし、人工知能 (AI) の未来を築き、次世代のテクノロジーをさらに推進するには、一連の目標と期待を設定する必要があります。2025 年までに、人工知能は質的に飛躍し、機械は大幅に賢くなるでしょう。

現在、ディープラーニング アルゴリズムに基づく多くのアプリケーションは、オブジェクト認識、自然言語処理 (NLP)、翻訳などの関連する認識タスクや、広範なデータ相関処理を伴うその他のタスク (推奨システムなど) を解決しています。ディープラーニング システムは、微分可能なプログラミングと複雑なデータに基づく相関関係に依存して優れた結果を生み出し、今後数年間で業界全体を変革すると期待されています。しかし同時に、機械学習、あるいはもっと広義には人工知能の可能性をさらに実現するためには、ディープラーニング自体に内在する限界を克服しなければなりません。非漸進的イノベーションを実現するには、次の 3 つの分野で協力する必要があります。

  • モデル効率を大幅に向上させる(例:精度を低下させることなくパラメータの数を 2 ~ 3 桁削減する)。
  • モデルの堅牢性、拡張性、スケーラビリティを大幅に向上します。
  • 機械の認知能力を総合的に向上します。

図 | ディープラーニングベースの言語モデルのパラメータ数は指数関数的に増加します (出典: Microsoft)

プルーニング、スパース性、圧縮、蒸留、グラフ ニューラル ネットワーク (GNN) などの手法はモデルの効率性を向上させることができますが、最終的には漸進的な改善も生み出します。結果を損なうことなくモデルのサイズを数桁縮小するには、情報の取得方法と表現方法、およびディープラーニング モデルの学習機能に、より根本的な変更が必要になる可能性があります。さらに、継続的な進歩には、より計算効率の高いディープラーニング手法や他の機械学習手法への移行が必要になります。現在、大量の事実とデータの埋め込みを補助的な情報リポジトリの検索に置き換えることで、有望な AI システムが急速に普及しつつあります。

同時に、統計的機械学習手法は、トレーニング サンプルの分布が推論中に処理する必要があるものを表すという仮定に基づいており、実際の使用では大きな欠陥があります。ディープラーニング モデルは、トレーニング データ セットがまばらにサンプリングされていたり、サンプルが不足している場合に特に困難になります。

さらに、転移学習や少数ショット/ゼロショット推論で達成された結果も満足のいくものではありません。モデルのスケーラビリティが非効率なため、データセットとデータ サイエンティストが不足している多くの分野に AI を拡張することができません。さらに、ディープラーニングはデータの変動に非常に影響を受けやすく、信頼性の低い分類につながりますが、この問題はモデルの堅牢性とスケーラビリティを向上させることで解決できます。

最後に、ニューラル ネットワークはほとんどの場合、認知、推論、解釈可能性を適切に提供できません。ディープラーニングには、抽象的、文脈的、因果的、解釈可能、理解可能な推論を実行するための認知メカニズムが欠けています。

次の段階: 認知AI

人工知能は人間の理解力のレベルに到達すると期待されています。ヨシュア・ベンジオは、ダニエル・カーネマンが著書『ファスト&スロー』で定義したパラダイムに基づき、現代のディープラーニングの機能を、彼が「システム 1」と表現する、直感的、高速、無意識、習慣的、完全に自発的に制御される特性と同一視しています。対照的に、AI システムの次の課題は、計画や推論に必要な、低速で論理的、順次的、意識的、アルゴリズム的な「システム 2」機能を実装することだと彼は指摘します。

[[441940]]

(出典: Pixabay)

同様に、フランソワ・ショレは、幅広い一般化に基づき、幅広い領域にわたる未知のイベントに適応できる人工知能(「柔軟な AI」)の開発における新たな段階について説明しています。これら 2 つの特性は、コンテキスト適応、抽象化、推論、説明可能性を特徴とする DARPA (国防高等研究計画局) の「人工知能の第 3 波」と一致しています。これらの機能を実現する 1 つの方法は、ディープラーニングを記号的推論および深い知識と組み合わせることです。これからは、AI のこの新しい段階を指すときに「認知 AI」という用語を使用します。

オープンな汎用人工知能 (AGI) の実現はまだ先ですが、より高度な認知能力を持つ AI はテクノロジーとビジネスにおいてより大きな役割を果たすことができます。 AI が予測不可能な環境でも信頼性の高い判断を下せるようになれば、最終的には AI の自律性が高まり、ロボット工学、自律輸送、物流、産業、金融システムの制御ポイントなどの分野で重要な役割を果たすようになります。

認知人工知能における構造化知識の役割

人工知能の分野では、ディープラーニングのさらなる発展によってより高度な機械知能を実現できると考える人がいる一方で、他の基本的なメカニズムを組み込む必要があると考える人もいます。私は以下の理由から後者の見解に同意します。

ディープラーニングは、埋め込み空間内の多次元構造の入力から予測出力への統計ベースのマッピングを習得します。これにより、広いデータと浅いデータ (画像内の単語やピクセル/ボクセルのシーケンスなど) を区別するのに優れています。さらに、ディープラーニングは、NaturalQA や EffiicentQA などのベンチマークで実証されているように、Wikipedia などのリソースのインデックス作成や、コーパス内の最適な一致からの回答の取得にも同様に効果的です。 Bengio の定義によれば、システム 1 のタスクはトレーニング中に作成された統計マッピング関数に依存します。ディープラーニングはこれらのタスクの達成に役立ちます。

対照的に、構造化され、明示的で、理解可能な知識は、より高度な機械知能またはシステム 2 機能を実現するための道筋を提供できます。基本的な知識構成とは、要素と概念に関する宣言的知識をキャプチャし、抽象的な概念 (クラス間の階層的な属性継承など) をエンコードする機能です。たとえば、鳥に関する知識、スズメ目の鳥に関する情報、スズメに関する詳細な情報を組み合わせると、具体的な指示がなくても、クリムゾンスズメに関する多くの暗黙の情報が得られます。さらに、他の知識構築には因果モデルや予測モデルが含まれます。

このような構築は、潜在空間に埋め込まれたマシンではなく、明示的な概念と明確に定義された関係に依存しているため、結果として得られるモデルは、統計マッピングの能力をはるかに超える、はるかに幅広い説明力と予測力を持つことになります。

[[441941]]

(出典: Pixabay)

人間の脳には、経験や観察の範囲を超えた方法で、将来の起こりうる出来事を「想像」し、シミュレートし、評価する能力があります。同時に、これらの特徴は人間の知能に進化上の利点をもたらします。明示的なルールに制約されない環境では、起こりうる将来の出来事の精神的なシミュレーションは、計画と問題解決において大きな適応価値を持つ世界ダイナミクスの基本モデルに基づいています。

入力から出力までの観察可能な統計的相関関係ではなく、暗黙の数学的、物理的、または心理学的原理に基づくプロセス モデリング メカニズムは、より高い認知能力を実現するために不可欠です。たとえば、物理モデルはハイドロプレーニング現象を捉え、さまざまな条件下での自動車の動きについて簡単な予測を行うことができます。このようなプロセス モデルは、ディープラーニング ベースのアプローチと組み合わせて使用​​することで、現在の人工知能の機能を拡張できます。

知識ベースは、ディープラーニング システムのトレーニング データに必ずしも明示的に存在するわけではない常識的な仮定と基礎となるロジックをキャプチャ (または暗黙的に表現) できます。これは、世界とそのダイナミクスを理解することが、より高度な機械知能のタスクを解決するのに役立つことを示唆しています。最後に、合理的に構造化された知識は、コンテキストと集約コンテンツの観点から曖昧さを解消できます (「クラブ」の属性を野球、武器、カード、パーティーの場所として分類する)。

認知人工知能と知識時代

今後数年間で、浅いマッピング機能がより充実し、計算処理がより安価かつ高速になるにつれて、ディープラーニングベースのシステム1 は大きな進歩を遂げると予想されます。認知人工知能は、さらに高度な機能ももたらすでしょう。

要約すると、2025 年までに、現在のディープラーニング ベースのシステムよりも説明力が高く、自律的な推論能力が人間レベルに近づく新しいタイプの認知 AI が登場すると考えています。

機械知能と認知の交差点におけるインテルのイノベーションを推進し、新たな認知 AI の機能を継続的に進化させるために、インテル ラボに認知コンピューティング研究部門を設立しました。私たちは、ディープラーニングの最新の進歩と知識構築およびニューラルシンボリック AI の統合を組み合わせて、複雑なシナリオでインテリジェントな意思決定を行うことができる自己学習型 AI を構築することを目指しています。

ディープラーニングにより、AI システムは認識、知覚、翻訳、推奨システムのタスクで優れた結果を達成できるようになります。次世代の機械学習と人工知能技術の台頭により、より強力な理解力と認知能力を備えた新しいタイプの人工知能が生まれ、私たちの生活にさらなる利便性がもたらされるでしょう。

<<:  人工知能は人類のより良い生活を可能にする

>>:  人生の意味とは何でしょうか?ステーションBのUP司会者がAIに「究極の質問」を投げかけた

ブログ    
ブログ    

推薦する

CMU の専門家が「マルチモーダル機械学習」の 6 つの主要な課題を包括的にまとめています。36 ページの長い記事 + 120 ページの PPT、すべて実用的な情報です。

さまざまな言語、視覚、ビデオ、オーディオなどの大規模モデルのパフォーマンスが向上し続けるにつれて、マ...

...

軽量で大規模な機械学習アルゴリズムライブラリ Fregata オープンソース: 高速、パラメータ調整不要

1. 大規模機械学習の課題インターネットとモバイルインターネットの普及により、利用可能なデータの量は...

...

...

人工知能はクラウドストレージとデータサービスの革新を推進する

[[358649]]従来のストレージとデータ構造が、クラウドネイティブ アプリケーションに必要な移植...

ファッション業界に人工知能を応用するには、もう少し想像力が必要かもしれない

[[343916]]現在、ファッション業界における人工知能(AI)技術の応用範囲は、依然としてプロセ...

Google Cloud AI が機械学習にどのように役立つかを包括的に説明します

[51CTO.com クイック翻訳] 調査によると、Google Cloud AI および機械学習プ...

...

顔認識禁止が迫る:テクノロジー企業はどこへ向かうべきか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

IoT、AI、デジタルツインをどのように統合するのか?

デジタル ツインは、物理世界とデジタル世界をつなぐため、常に興味深いものです。将来的には、すべてのも...

...

...