あなたたちは AI を大々的に宣伝していますが、AI はまだ 4 歳児ほど賢くありません。

あなたたちは AI を大々的に宣伝していますが、AI はまだ 4 歳児ほど賢くありません。

研究によると、人工知能は強力に聞こえますが、現在の高度な人工知能は、人間の 4 歳児が簡単に解決できる問題を解くにはほど遠いことがわかっています。では、人工知能は 4 歳児よりも賢くなるのでしょうか?子どもたちがどのように情報を処理し、学習するかを観察することで、インスピレーションを得られるかもしれません。

人工知能、特に機械学習の新たな進歩については誰もが聞いたことがあるでしょう。印象的な名前にもかかわらず、この技術は主に大規模なデータセット内の統計パターンを検出する技術で構成されており、人間はそれ以上のことを学習します。

人間がどのように学ぶか

私たちはどのようにして周囲の世界についてこれほど多くのことを知るのでしょうか?子どものころから、私たちはたくさんのことを学びます。4 歳児はすでに、植物、動物、機械、欲望、信念、感情、さらには恐竜や宇宙船について知っています。

科学は、世界に関する私たちの知識を想像もつかない限界、宇宙の果て、そして時間の始まりまで広げました。私たちはこの知識を使って、新しい分類や予測を行い、新しい可能性を想像し、私たちの網膜に当たる光子の流れと鼓膜を揺らす空気だけが触れる世界で新しいことを起こします。私たちが持っている例が非常に限られているのに、目の後ろにある数ポンドの灰色の粘液でどうやってこれらすべてを行うのでしょうか?

[[258651]]

(出典:スミソニアンマガジン)

これまでのところ、最も良い答えは、私たちの脳が感覚に届く特定の、しかし乱雑なデータに対して操作を実行し、その操作によって、三次元物体の知覚、言語の基礎となる文法、「心の理論」などの精神的能力を含む、構造化され、抽象的で、階層的であるように見える世界の正確な記述が生成されるというものです。

「心の理論」により、私たちは他の人が何を考えているのか理解することができ、こうした表現によって、人間特有の創造的な方法であらゆる種類の新しい予測を立て、多くの新しい可能性を想像することができるようになります。

この種の学習は知能の唯一の形ではありませんが、人間にとって特に重要です。これは幼い子供たちの得意分野です。子供たちは計画や意思決定が非常に苦手ですが、世界で最も優れた学習者です。実際、データを理論に変えるプロセスの多くは、私たちが 5 歳になる前に行われます。

人間が学ぶ基本的な方法は2つある

アリストテレスとプラトン以来、私たちが知っていることをどのように知るかという問題に対して 2 つの基本的なアプローチがあり、それらは今でも機械学習の主流となっています。

アリストテレスは、この問題に下からアプローチしました。つまり、感覚、つまり空気中の光子の流れと振動(またはデジタル画像や録音のピクセル、またはサウンドサンプル)から始めて、そこに学習したパターンを検出できるかどうかを確認します。このアプローチは、哲学者のデイヴィッド・ヒュームやJ・S・ミルなどの古典的な連想主義者によってさらに進められ、後にはパブロフやB・F・スキナーなどの行動心理学者によっても採用されました。この観点から見ると、表現の抽象性と階層構造は幻想、あるいは少なくとも付随現象であり、特に十分なデータがある場合、すべての作業は関連付けとパターン検出を通じて実行できます。

このボトムアップ学習法は、プラトンのトップダウン学習法と常に共存しており、どちらも常に他方を抑制することはできません。

おそらく、私たちはすでに多くのことを知っており、特に進化のおかげで、一連の基本的な抽象概念をすでに持っているため、具体的なデータから抽象的な知識を導き出すことができるのでしょう。科学者のように、私たちはこれらの概念を使って世界についての仮説を立て、その仮説が正しければ、生のデータからパターンを見つけようとするのではなく、データがどのようになるかを予測することができます。これは、デカルトやノーム・チョムスキー、プラトンなどの「合理主義」の哲学者や心理学者が採用したアプローチです。

2 つのアプローチの違いを示す日常的な例として、スパム フラッディングの問題を解決することが挙げられます。電子メール データは、受信トレイ内の分類されていないメッセージの長いリストで構成されます。実際には、電子メールの中にはスパムではないものもあれば、スパムであるものもあります。データを使用してそれらを区別するにはどうすればよいでしょうか?

まずボトムアップ アプローチを検討してください。スパムには、受信者リストが長い、ナイジェリアから送信されている、100 万ドルの賞金や媚薬について言及しているなど、特定の特徴がある傾向があることに気付くでしょう。問題は、完全に役立つ非スパム メッセージにもこれらの特徴がある可能性があることです。スパムと非スパムの例を十分に調べると、スパム メッセージにこれらの特徴があるだけでなく、特定の方法で一緒に表示される傾向があることもわかります (ナイジェリア発で 100 万ドルの賞金について言及されている場合は問題があることを意味します)。

実際、スパムと有用な非スパムを区別するために使用できる、微妙で高レベルの相関関係がいくつかある可能性があります。たとえば、スペルミスや IP アドレスは一意であり、それらの一意のパターンが検出されると、スパムをフィルター処理できます。これがボトムアップの機械学習技術が行うことです。学習者には何百万もの例が与えられ、それぞれが特定の特徴を持ち、それぞれがスパム(または他のカテゴリ)としてラベル付けされ、コンピューターは、たとえそれらの特徴が非常に微妙であっても、2つを区別するパターンを抽出できます。

トップダウンアプローチはどうでしょうか?たとえば、Journal of Clinical Biology の編集者から、自分の論文についてメールを受け取ったとします。そのメールには、自分の論文を 1 つ出版したいと書かれています。メールはナイジェリアから来たものではなく、本文にはバイアグラや 100 万ドルの賞金について触れられていません。このメールにはスパムの特徴はまったくありませんが、すでに知っている知識を使って、スパムが生成されるプロセスを抽象的に考えると、このメールは疑わしいと結論付けることができます。

1. スパマーは人間の欲望を利用して人々から金銭を搾取しようとしていることはご存じでしょう。

2. あなたは、通常の「オープン アクセス」ジャーナルが購読者ではなく著者に料金を請求することでコストを賄い始めていることも知っていますが、あなたは臨床生物学などの分野で働いていません。

これらの要素をすべて組み合わせると、電子メールの発信元に関する新しい仮説を思いつくことができます。その目的は、偽のジャーナルに論文を「掲載」するために学者を騙して金銭を支払わせることです。この電子メールは、他のスパムメールと同様に、スパムにはまったく見えませんが、作成プロセスに疑問があります。例からこの結論を導き出すことができます。また、電子メール自体を超えて、電子メールを送信した編集者の情報を Google で検索することで、仮説をさらに検証できます。

コンピューター用語で言えば、貪欲や欺瞞などの抽象的な概念を含み、スパム生成プロセスを記述する「生成モデル」から始めます。これにより、ナイジェリアからの典型的なスパムを認識できるだけでなく、さまざまな種類の潜在的なスパムを想像することもできます。そのため、ウォール ストリート ジャーナルから電子メールを受け取ったときに、逆方向に作業して、「これはスパム生成プロセスによって生成された種類の電子メールのようです」と言うことができます。

AI に関して新しくて興味深いのは、AI 研究者が最近これら 2 つの強力で効果的な学習方法を開発したことですが、批評家はこれらの方法自体には新しくて深遠な点は何もないと言います。

ボトムアップ型ディープラーニング

1980 年代に、コンピューター科学者は、コンピューターがデータ内のパターンを検出できるようにする独創的な方法、つまりチェーン型、つまりニューラル ネットワーク アーキテクチャを発明しました。このアプローチは 1990 年代に衰退しましたが、Google の DeepMind などの強力な「ディープラーニング」手法の台頭により、最近復活しました。

たとえば、「猫」、「家」などのラベルが付いた Web 画像のセットをディープラーニング プログラムに入力することができます。プログラムは、2 セットの画像を区別するパターンを検出し、その情報を使用して新しい画像に正しくラベルを付けることができました。

教師なし学習として知られる機械学習技術は、ラベル付けされていないデータ内のパターンを検出できます。つまり、科学者が因子分析と呼ぶ特徴のセットを探します。ディープラーニングマシンでは、これらのプロセスがさまざまなレベルで繰り返され、一部のプログラムではピクセルやサウンドなどの生データから関連する特徴を発見することもできます。たとえば、コンピューターはまず生画像内でエッジや線に対応するパターンを検出し、次にその中から顔に対応するパターンを見つける、といった具合です。

長い歴史を持つもう一つのボトムアップ手法は強化学習です。 1950 年代、BF スキナーはジョン・ワトソンの研究を基に、ハトに特定の報酬と罰を与えることで、ハトが複雑な動作を行えるように制御しました。基本的な考え方は、望ましい行動が実行されるまで、報酬が与えられる行動は繰り返され、罰せられる行動は繰り返されないというものです。スキナーの時代でさえ、この単純なプロセスを何度も繰り返すことで複雑な動作につながる可能性がありました。コンピューターは、人間の想像を超える規模で単純な操作を何度も実行するようにプログラムされており、計算システムはこのようにして非常に複雑なスキルを学習することができました。

強化学習(インターネットから)

たとえば、Google の DeepMind の研究者は、ディープラーニングと強化学習を組み合わせて、コンピューターに Atari のビデオ ゲームをプレイする方法を教えました。コンピューターはこれらのゲームのプレイ方法をまったく知りませんでした。最初は、コンピューターの動作はランダムで、各瞬間の画面の様子とスコアに関する情報のみを取得していました。ディープラーニングは、コンピューターが画面上の特徴を解釈するのに役立ち、強化学習はシステムがより高いスコアを獲得するように促しました。コンピューターはいくつかのゲームを非常に上手にプレイしましたが、人間にとって簡単な他のゲームはまったくプレイできませんでした。

ディープラーニングと強化学習を同様に組み合わせることで、DeepMind の AlphaZero プログラムは、ゲームのルールに関する基本的な知識とある程度の計画能力しか持たないにもかかわらず、チェス、そして囲碁で人間のプレイヤーに勝つことができました。 AlphaZero のもう 1 つの興味深い特徴は、自分自身と何億回も対戦できることです。その過程で、負けにつながるミスを排除しながら、勝利につながる戦略を繰り返し明確にします。このシステムや、生成的敵対ネットワーク テクノロジーを使用する他のシステムは、データを生成すると同時にそれを観察します。

これらの技術を非常に大規模なデータセット、何百万もの電子メール、Instagram の写真、音声録音に適用できる計算能力があれば、これまでは非常に困難と思われていた問題を解決できます。それがコンピューター サイエンスの面白いところです。

しかし、写真の中の猫を認識したり、「Siri」のような話し言葉を認識したりするような問題は、幼児の人間にとっては簡単なことであり、コンピューター サイエンスにおける最も興味深い発見の 1 つは、人間にとっては簡単な問題 (猫を認識するなど) がコンピューターにとっては難しい (チェスや囲碁をするよりもはるかに難しい) ということだ。人間がほんの数例で分類できるオブジェクトを、コンピューターが分類するには何百万もの例が必要です。

トップダウンベイジアンモデル

トップダウンアプローチは人工知能の初期開発において大きな役割を果たし、2000 年代には確率的またはベイズ的生成モデルの形で復活しました。

このアプローチを使用する初期の試みでは、2 つの問題に直面しました。まず、図示したパターンのほとんどは、一般的にいくつかの異なる仮説によって説明できます。ジャーナル編集者からの電子メールはスパムではない可能性がありますが、それはありそうにありません。第二に、生成モデルで使用される概念はどこから来るのでしょうか?プラトンとチョムスキーは「人はこれらのものを持って生まれる」と言いましたが、新しい科学的概念をどのように学ぶのかをどう説明すればよいのでしょうか?子どもたちは恐竜や宇宙船をどのように理解するのでしょうか?

ベイズモデルは、生成モデルと仮説検定を確率理論と組み合わせて、これら両方の問題に対処します。ベイジアン モデルを使用すると、データに基づいて特定の仮説が正しい可能性を計算できます。既存のモデルに小さな体系的な調整を加え、データに対してテストすることで、古い概念やモデルから新しい概念やモデルを作成できる場合があります。ただし、これらの利点は他の問題によって相殺されます。ベイジアン手法は、2 つの仮説のうちどちらがより可能性が高いかを選択するのに役立ちますが、ほとんどの場合、潜在的な仮説は多数存在し、すべての仮説を効果的に考慮できるシステムはありません。

ベイジアンモデル(インターネットより)

ニューヨーク大学のブレンデン・レイク氏とその同僚は、このトップダウンアプローチを使用して、人間にとっては簡単だがコンピューターにとっては非常に難しい別の問題、つまり、なじみのない手書き文字の認識を解決しました。日本の巻物に書かれた文字を見ると、たとえ見たことがなくても、他の日本の巻物に書かれた文字と似ているか違うかがわかります。また、その文字を描いたり、見た文字に基づいて偽の日本語の文字をデザインしたりすることもできます。

手書き文字を認識するためのトップダウン方式では、各文字の何千ものサンプルをコンピューターに入力し、顕著な特徴を抽出させるのに対し、レイクのチームは、文字の書き方の一般的なモデルをプログラムに入力した。つまり、ストロークは右または左に進み、1 つのストロークが完了すると次のストロークが始まり、というように続く。プログラムは特定の文字を見ると、その文字につながる可能性が最も高いストロークのシーケンスを推測できる。これは、電子メールの書き方に基づいて、その電子メールがスパムである可能性が高いと推測するのと同じである。次に、新しい文字がそのストローク シーケンスから生成されたのか、別のストローク シーケンスから生成されたのかを判断し、同様のストロークのセットをプログラム自体で生成できる。

このプログラムは、まったく同じデータに適用されたディープラーニング プログラムよりもはるかに効果的であり、実際に人間のプロセスを反映しています。

どちらの機械学習アプローチにも、それぞれ長所と短所があります。ボトムアップ アプローチでは、プログラムは最初は多くの知識を必要としませんが、大量のデータが必要であり、限られた方法でしか一般化できません。トップダウン アプローチでは、プログラムは少数の例から学習し、より幅広く多様な一般化を行うことができますが、最初にプログラムに多くのことを浸透させる必要があります。現在、多くの研究者がこれら 2 つのアプローチを組み合わせ、ディープラーニングを使用してベイズ推論を実装しようとしています。

AI の最近の成功は、部分的には古いアイデアの拡張から生じていますが、より重要なのは、インターネットのおかげでデータが増え、ムーアの法則のおかげでそのデータに適用できる計算能力が高まったという事実です。

さらに、私たちが持っているデータはすでに人間によって収集され、処理されているという事実は、あまり認識されていません。オンラインに投稿された猫の写真は、典型的な猫の写真であり、人間がすでに「良い」と選択した写真です。Google 翻訳がうまく機能するのは、文章自体を真に理解するのではなく、何百万もの人間による翻訳を参考にして、それを一般化して新しいテキストに適用しているからです。

子どもの学習方法は機械とどう違うのでしょうか?

しかし、子供たちの本当に注目すべき点は、彼らがこれらの機械学習手法のそれぞれの特徴を何らかの方法で組み合わせ、それらをはるかに上回っていることです。

過去 15 年間、発達学者は、子どもがデータから構造を学ぶ方法を研究してきました。4 歳児は、トップダウン システムのように、1 つまたは 2 つのデータ例から非常に異なる概念を誘導して学習できますが、ボトムアップ システムのように、データ自体から新しい概念やモデルを学ぶこともできます。

たとえば、研究室では、研究者たちは子供たちに「ブリケット検出器」を渡しました。これは、特定の物体を置くと光って音楽を奏でる、これまで見たことのない新しい機械です。研究者たちは子供たちに、機械の仕組みの例を 1 つか 2 つだけ示し、赤い立方体を 2 つ置くと機械は作動するが、緑の立方体と黄色の立方体を 1 つ置くと作動しないことを伝えました。

18 か月の赤ちゃんでも、それが機能するための基本原理、つまり 2 つのブロックが同一でなければならないことをすぐに理解します。彼らはこの原理を新しい例に一般化しました。たとえば、機械を動作させるために同じ形状の 2 つのオブジェクトを選択します。他の実験では、子供たちは、機械が動くのは何らかの隠された無形の特性によるものであることや、機械が何らかの抽象的な論理原理に基づいて動作していることを理解できることが研究者によって示されています。

これは子どもたちの日々の学習にも見られます。比較的データが少ない場合でも、幼児は生物学、物理学、心理学の抽象的でありながら直感的な理論を大人の科学者と同じくらい速く学ぶことができます。

近年、AI システムによって達成された機械学習の目覚ましい成果はすべて、ボトムアップ アプローチであれトップダウン アプローチであれ、有限かつ明確に定義された仮定と概念の空間、つまりゲームの駒と動きの正確なセット、事前に決定された画像のセットの中で実現されています。対照的に、子どもや科学者は、既存の概念を単純に調整するのではなく、概念を根本的に変えてパラダイムシフトを起こすこともあります。

[[258653]]

(インターネットより引用)

4 歳児はすぐに猫を識別し、単語の意味を理解できますが、自分の経験をはるかに超えた創造的で驚くべき新しい推論を行うこともできます。たとえば、私の孫は最近、大人がもう一度子供に戻りたいなら、健康的な野菜を一切食べないようにすべきだと言いました。なぜなら、健康的な野菜は子供が大人に成長できるようにするものだからです。この一見合理的な仮定は、大人なら誰でも受け入れるものではありません。しかし、そのような仮定をするのは子供だけです。実際、私と私の同僚は、未就学児は年長児や大人よりも、ありそうもない仮説を立てるのが得意であることを体系的に実証してきましたが、彼らがどのようにしてこのように創造的な方法で学び、革新できるのかはほとんどわかっていません。

それでも、子供たちの行動を観察することで、プログラマーはコンピューター学習をどこに向かわせるべきかについて役立つヒントを得られるかもしれません。子供の学習には特に注目すべき 2 つの特徴があります。子供は能動的な学習者であり、人工知能のように受動的にデータを吸収するのではないということです。実験を行う科学者のように、子どもたちは果てしない遊びや探索を通して周囲の世界から情報を得ようとする本質的な動機を持っています。

最近の研究によると、この探究は見た目よりも体系的であり、仮説形成と理論選択を裏付ける説得力のある証拠を見つけるのに適しているとのことです。そのため、機械に好奇心を組み込み、機械が世界と積極的にやりとりできるようにすれば、機械の学習をより本物で広範囲なものにできるかもしれません。

第二に、既存の人工知能とは異なり、子どもは社会的かつ文化的な学習者です。人間は閉じた状態で学習するのではなく、過去の世代が蓄積した知恵を活用します。最近の研究では、未就学児であっても他人の真似をしたり聞いたりして学習しますが、ただ受動的に教師に従うだけではありません。非常に微妙で敏感な方法で他人から情報を受け取り、情報の出所と信頼性について複雑な推論を行い、聞いた内容と自分の経験を体系的に統合します。

「人工知能」や「機械学習」という言葉は恐ろしく聞こえますし、ある意味では確かにその通りです。例えば、これらのシステムは武器の制御に使われており、私たちは本当に恐れるべきです。

しかし、人間の愚かさは人工知能よりもはるかに大きな損害を引き起こす可能性があり、これらの新しいテクノロジーを適切に習得するには、私たちが過去よりもはるかに賢くなる必要がありますが、終末予言や人工知能が人間に取って代わるというユートピア的なビジョンの根拠はほとんどありません。

学習の根本的なパラドックスを解決しない限り、最高の AI であっても平均的な 4 歳児より優れていることはありません。

<<:  人工知能は徐々に成熟しつつあります。まずルールを見つけてから法律を作るのが良いでしょう。

>>:  賈陽青氏がフェイスブックを辞任し、アリババ・シリコンバレー研究所の副社長に就任したことが明らかになった。

推薦する

IBM、GPUに匹敵する新しいニューラルネットワークチップを開発

本日 Nature 誌に掲載された論文で、IBM Research のポスドク研究員 Stefano...

OpenLLMを使用して大規模なモデルアプリケーションを構築および展開する

この共有のテーマは、「OpenLLM を使用して大規模な言語モデル アプリケーションを迅速に構築およ...

Appleは、生成AIをiPhone上でローカルに実行できるようにするために、より多くの人材を採用している。

8月6日、今年初めから、生成型人工知能への熱狂がテクノロジー業界全体を席巻しているというニュースが...

Nature Review: 機械学習の物理的発見 - 隣にあるもう一つの機会の道

[[437564]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

GPT-4 は宇宙のすべてのデータを消費します! OpenAI、データ不足で相次いで訴訟に直面、カリフォルニア大学バークレー校教授が警告

「ネットワーク全体」を使い果たすと、生成 AI はすぐにデータを使い果たします。最近、カリフォルニア...

ChatGPTはPyTorchなしでは構築できません。LeCunの発言は白熱した議論を引き起こしました。モデルメーカーが重量を公開しない理由は、

ここ2日間で、オープンソースの話題が再び人気を集めています。 「オープンソースがなければ、AI は何...

北京大学はChatGPTを使用して開発チームを構築し、AIが人間の介入なしにソフトウェア開発を自律的に完了します

「一人の能力には限界があるが、チームの力は無限である。」この言葉は、現実世界のソフトウェア開発に鮮や...

エンジニアがソフトロボットを制御する空気圧式コンピュータメモリを開発

海外メディアの報道によると、カリフォルニア大学リバーサイド校のエンジニアらが、ソフトロボットの動きを...

AI イニシアチブを成功させるために必要な 10 のこと

市場で競争上の優位性を獲得する過程で、多くの企業が新興技術の導入に熱心です。しかし、導入を急ぐあまり...

人工知能と機械学習の違いと影響は何ですか?

人工知能と機械学習は、意思決定を行うコンピューターが部署や課全体に取って代わる世界を思い起こさせます...

BigDL-LLMを使用して、数百億のパラメータを持つLLM推論を即座に加速します。

私たちは、顧客サービス、仮想アシスタント、コンテンツ作成、プログラミング支援などのさまざまなアプリケ...

マイクロソフトの小型モデルが大型モデルに勝利:27億のパラメータ、携帯電話で実行可能

先月、マイクロソフトのCEOであるサティア・ナデラ氏はIgniteカンファレンスで、自社開発の小型モ...

通信事業者のRPAロボット活用事例紹介

国際・国内電話サービス、インターネット事業、通信ネットワーク資源・設備サービスなどを主力事業とする米...

...