この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 今日の AI システムは、数学、ゲームのプレイ、リアルな画像の生成など、幅広い分野で複雑なタスクを実行できます。しかし、家事ロボットや自動運転車など、AI の初期の目標に近づくにつれて、それらの目標は消え去っていくでしょう。 こうした目標が達成されないというサイクルが続いているのは、AIと自然知能に関する誤った想定が一因だと、サンタフェ研究所の複雑性教授で『人工知能:人間の心のためのガイド』の著者でもあるメラニー・ミッチェル氏は述べた。 「なぜAIは私たちが考えるよりも難しいのか」と題された新しい論文で、ミッチェル氏は、一般の人々やメディアだけでなく専門家の間でも誤解を引き起こしているAIに関する4つのよくある誤解について論じています。これらの誤解は、人間の認知能力や一般的な問題解決能力に匹敵する AI システムをどの程度実現できるかについて、誤った自信を与えます。 狭義のAIと汎用AIは同じようにはスケールしない既存の AI は限定された問題を非常にうまく解決できます。例えば、囲碁やチェスで人間を凌駕したり、X線画像から癌のパターンを驚異的な精度で検出したり、音声データをテキストに変換したりすることができます。 しかし、単一の問題を解決できるシステムを設計しても、必ずしもより複雑な問題の解決に近づくわけではありません。ミッチェルは最初の誤りを「狭義の知性は一般の知性と連続している」と説明しています。 「人々は、狭い分野で機械が何か素晴らしいことをしているのを見たときでさえ、その分野は汎用AIに向けてはるかに進んでいると想定することが多い」とミッチェル氏は論文に書いている。 たとえば、今日の自然言語処理システムは、翻訳、テキスト生成、特定の質問に対する回答など、さまざまな問題を解決する上で大きな進歩を遂げてきました。 同時に、音声データをリアルタイムでテキストに変換できるディープラーニングシステムも備えています。これらの成果の背後には、何千時間もの研究開発(そしてコンピューティングとデータに費やされた何百万ドルもの費用)があります。しかし、AI コミュニティは、長期間にわたって一貫性を失うことなく、オープンエンドの会話に参加できるエージェントを作成するという問題をまだ解決していません。このようなシステムは、単なる小さな問題を解決するだけでは不十分です。 これには常識が必要であり、これは AI がまだ解決していない重要な課題の 1 つです。 単純なことは自動化が難しい人間に関して言えば、私たちは何年もの研究と練習を要する難しいことを、知的な人間にやってもらいたいのです。例としては、微積分や物理学の問題を解く、グランドマスターレベルでチェスをプレイする、大量の詩を暗記するなどのタスクが挙げられます。 しかし、数十年にわたる AI 研究により、自動的な注意を必要とする困難なタスクは自動化が容易であることがわかっています。単純なタスク、つまり私たちが当たり前だと思っていることを自動化するのは困難です。ミッチェルは、2 番目の誤謬を「簡単なことは簡単で、難しいことは難しい」と説明しています。 「私たち人間が無意識に行っていること、つまり世界を見て理解すること、会話を続けること、混雑した歩道を誰にもぶつからずに歩くことなどは、機械にとって最も難しい課題である」とミッチェル氏は書いている。 逆に言えば、人間にとって非常に難しいことを機械が簡単に行えることも少なくありません。たとえば、複雑な数学の問題を解いたり、チェスや囲碁などのゲームをマスターしたり、何百もの言語間で文章を翻訳したりすることは、すべて機械にとって比較的簡単になりました。 たとえば、視覚について考えてみましょう。数十億年をかけて、生物は光信号を処理するための高度な装置を開発してきました。動物は目を使って周囲の物体を把握し、環境内を移動し、食べ物を見つけ、脅威を感知し、生存に不可欠な他の多くのタスクを実行します。私たち人間は、これらの能力をすべて祖先から受け継いでおり、無意識のうちにそれらを使用しています。しかし、その根底にある仕組みは、高校や大学を悩ませる複雑な数式よりも確かに複雑です。 一例を挙げると、人間の視覚と同じくらい汎用的なコンピューター ビジョン システムがまだ存在していません。私たちは、物体の検出や画像の分割など、動物や人間の視覚システムの一部を大まかにシミュレートできる人工ニューラル ネットワークを作成することに成功しました。しかし、それらは脆弱で、さまざまな種類の外乱に敏感であり、生物の視覚が達成できるすべてのタスクを模倣することはできません。このため、例えば、自動運転車で使用されるコンピューター ビジョン システムは、LIDAR やマッピング データなどの高度なテクノロジーで補完される必要があります。 非常に困難であることが証明されているもう一つの分野は、人間が明確な訓練なしに習得できる感覚運動能力です。物の扱い方、歩き方、走り方、ジャンプの仕方を考えます。これらは意識的な努力なしに実行できるタスクです。実際、歩きながらポッドキャストを聞いたり、電話をかけたりといった他のこともできます。しかし、これらのスキルは、現在の AI システムにとって依然として大きな課題であり、コストもかかります。 「AIは私たちが考えるよりも難しい。なぜなら私たちは自分の思考プロセスの複雑さにほとんど気づいていないからだ」とミッチェル氏は書いている。 擬人化AIは役に立たない人工知能の分野には、ソフトウェアを人間の知能と同じレベルに引き上げる語彙が溢れています。 AI アルゴリズムの仕組みを説明するために、「学習」、「理解」、「読み取り」、「思考」などの用語を使用します。このような擬人化された用語は、複雑なソフトウェアのメカニズムを簡略化するための略語としてよく使用されますが、現在の AI システムが人間の脳のように動作すると誤解させる可能性があります。 ミッチェル氏はこの誤りを「希望的記憶術の誘惑」と呼び、「このような省略形は、これらの結果を理解しようとする一般大衆(およびそれを報道するメディア)を誤解させる可能性があり、また、AIの専門家でさえも、そのシステムや、それらのシステムが人間の知能とどれほど類似しているかについて考える方法に無意識のうちに影響を与える可能性がある」と書いている。 希望的観測により、AI コミュニティはアルゴリズム評価ベンチマークに誤解を招くような名前を付けるようになりました。たとえば、AI 分野で最も尊敬されている組織や学術機関によって開発された General Language Understanding Evaluation (GLUE) ベンチマークを考えてみましょう。 GLUE は、言語モデルがトレーニング済みのタスクを超えてどの程度一般化できるかを評価するのに役立つ一連のタスクを提供します。しかし、メディアが伝えているのとは反対に、AI エージェントが人間よりも高い GLUE スコアを達成したとしても、その言語理解能力が人間よりも高いということではありません。 「これらの特定のベンチマークでは機械が人間を上回っているが、AIシステムはベンチマーク名に関連付けられているより一般的な人間の能力に匹敵するにはまだ程遠い」とミッチェル氏は書いている。 希望的観測の明確な例は、Facebook AI Research による 2017 年のプロジェクトです。このプロジェクトでは、科学者が 2 つの AI エージェントを訓練し、人間の会話に基づいてタスクを交渉できるようにしました。研究者らはブログ記事で、「両エージェントのパラメータを更新すると、エージェントが交渉のための独自の言語を開発するため、人間の言語からの分岐が生じる(強調は筆者)」と指摘している。 その結果、AIシステムが人間よりも賢くなり、秘密の方言でコミュニケーションをとるようになると警告するクリックベイト記事が相次いでいる。 4年経った今でも、最先端の言語モデルは、ほとんどの人が幼い頃に指導なしに学ぶ基本的な概念を理解するのに苦労しています。 身体を持たないAI知性は世界の豊かな物理的経験から切り離されて存在できるのでしょうか?これは何世紀にもわたって科学者や哲学者を悩ませてきた疑問です。 ある学派では、知性はすべて脳の中にあり、身体から切り離すことができるとしており、これは「樽の中の脳」理論としても知られています。ミッチェルはこれを「知性はすべて頭の中にある」という誤謬と呼んでいる。適切なアルゴリズムとデータがあれば、サーバー内で動作し、人間の知能に匹敵する AI を作成できます。この考え方の支持者、特に純粋にディープラーニングベースのアプローチを支持する人々にとって、汎用 AI を実現するには、適切な量のデータを収集し、より大規模なニューラル ネットワークを作成することが不可欠です。 同時に、このアプローチが失敗する運命にあるという証拠も増えてきています。 「知能を理解し、人工知能を創造するための『全脳』情報処理モデルの基礎に疑問を抱く研究者が増えている」と彼女は書いている。 人間や動物の脳は、生存の可能性を高めるという究極の目標を掲げて、他のすべての人間の器官とともに進化してきました。私たちの知性は、私たちの身体の限界や能力と密接に結びついています。組み込み AI の分野は絶えず拡大しており、さまざまな感覚刺激を通じて環境と相互作用することでインテリジェントなスキルを開発できるエージェントを作成することが目的です。 ミッチェル氏は、神経科学の研究により「認知を制御する神経構造は、感覚および運動システムを制御する神経構造と密接に関連しており、抽象的思考は人体に基づく神経「マップ」を利用する」ことが示されていると指摘している。実際、フィードバックは体から来るという考えを裏付ける証拠や研究が増えている。脳のさまざまな感覚領域が私たちの意識的および無意識的な思考に影響を与えます。 ミッチェルは、感情、感覚、潜在意識の偏見、身体的経験は知性と切り離せないという考えを支持しています。 「心理学や神経科学の知識の中には、『純粋な合理性』が、私たちの認知や目標に影響を与える感情や文化的偏見から切り離せる可能性を裏付けるものは何もない」と彼女は書いている。
人工知能の常識汎用人工知能を開発するには、知能そのものに対する理解を調整する必要があります。私たちはいまだに、知能とは何か、そして人工世界と自然世界の両方で知能をどのように測定するかを定義するのに苦労しています。 「AIの進歩をより効果的に実装し評価するためには、機械が何ができるかを語る上でよりよい語彙を開発する必要があることは明らかだ」とミッチェル氏は書いている。
ミッチェル氏が論文で論じているもう一つの課題は常識の問題であり、彼女はそれを「今日の最も先進的な AI システムに欠けている一種の傘」と表現している。 常識とは、私たちが世界について獲得し、あまり努力せずに毎日適用している知識です。私たちは子供の頃、明確な指示がなくても世界を探検することで多くのことを学びます。これらには、空間、時間、重力、物体の物理的特性などの概念が含まれます。 たとえば、子どもは幼い頃から、物体が別の物体に遮られても消えずに存在し続けることや、ボールがテーブルの上を転がって棚に届くと落ちることを学びます。私たちはこの知識を使って、世界のメンタルモデルを構築し、因果推論を行い、かなり高い精度で将来の状態を予測します。 今日の AI システムにはこの知識が欠けており、予測不可能で大量のデータを必要とします。実際、この記事の冒頭で述べた 2 つの AI アプリケーション (家事と運転) は、ほとんどの人が常識と少しの練習を通じて習得できるものです。 常識には、人間性や人生に関する基本的な事実も含まれます。それは、読者や聞き手が知っているとわかっているため、会話や文章では省略する事柄です。たとえば、2 人の人が「電話で話している」場合、それは彼らが同じ部屋にいないことを意味することがわかります。また、「ジョンが砂糖に手を伸ばした」ということは、ジョンの近くのどこかに砂糖の入った容器があることを意味することもわかります。この知識は、自然言語処理などの分野では非常に重要です。 「そのような知識や能力を機械に取り込む方法はまだ誰も知らない。これがAI研究の現在の最先端であり、将来への有望な道の1つは、幼児のこうした能力の発達についてわかっていることを活用することだ」とミッチェル氏は書いている。 私たちはまだ多くの疑問に対する答えを知りませんが、解決策を見つけるための第一歩は、私たち自身の誤った考え方に気づくことです。 「これらの誤りとその微妙な影響を理解することで、より堅牢で信頼性が高く、潜在的に真に知的なAIシステムを構築する道筋が見えてくるだろう」とミッチェル氏は書いている。 |
>>: グラフアルゴリズムシリーズ: 計算グラフにおける最短経路
[[407368]]今の世界は30年前とは大きく異なります。この変化の理由の一部は技術の発展です。今...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
翻訳者 |李睿レビュー | Chonglou人工知能と機械学習は、ディープラーニング技術の力を活用し...
[[258526]]過去7年間、中国のプライベートエクイティ投資市場における人工知能分野への投資額は...
明らかに、AI とデータ分析の世界はダイナミックな変化の真っ只中にあります。将来は、イノベーションと...
[[209419]]オートエンコーダーは、入力データを効率的にエンコードする方法を学習するために使用...
スマートホームの発展過程で、その定義は何度も変化してきました。当初のリモートコントロールの概念から、...
1. 通信事業者は注文処理とサービスの有効化の簡素化に注力する効率性と俊敏性は、通信業界で成功するた...
[51CTO.comからのオリジナル記事] 2018年、人工知能は人類が未来を創造するための最も輝か...
先週の発表に続き、OpenAI は本日、GPT ストアの立ち上げを正式に発表しました。写真昨年 11...
データセットの構築、ニューラル ネットワークのコーディング、モデルのトレーニングに何週間も費やした後...