超大型モデルの登場でAIはゲームオーバーになるのか?ゲイリー・マーカス:道は狭くなっている

超大型モデルの登場でAIはゲームオーバーになるのか?ゲイリー・マーカス:道は狭くなっている

最近、人工知能技術は大規模モデルにおいて飛躍的な進歩を遂げています。昨日、Google が提案した Imagen が再び AI の能力に関する議論を巻き起こしました。事前トレーニングと大量のデータによる学習を通じて、このアルゴリズムはリアルな画像構築と言語理解において前例のない機能を実現しました。

多くの人々の目には、我々は汎用人工知能に非常に近づいているように見えますが、著名な学者でありニューヨーク大学の教授であるゲイリー・マーカス氏はそうは考えていません。

最近、彼の記事「代替知能の新科学」は、DeepMind の研究ディレクターである Nando de Freitas の「規模が勝つ」という見解を否定しました。彼が何を言ったのか見てみましょう。

以下はゲイリー・マーカス氏の原文です。

AI分野では数十年にわたり、人工知能は自然知能からインスピレーションを得るべきだという仮定が存在してきました。ジョン・マッカーシーは、AI に常識が必要な理由について、画期的な論文「常識のあるプログラム」を執筆しました。マービン・ミンスキーは、人間の心からインスピレーションを得ようと、有名な著書「心の社会」を執筆しました。行動経済学への貢献によりノーベル経済学賞を受賞したハーブ・サイモンは、有名な「思考モデル」を執筆しました。その目的は、「新たに開発されたコンピューター言語が、コンピューターが予測された人間の行動をシミュレートできるように、どのように精神プロセスの理論を表現することができるか」を説明することです。

私の知る限り、多くの AI 研究者 (少なくとも影響力のある研究者) は現在、このことについてまったく気にかけていません。代わりに、彼らは私が「Alt Intelligence」(この用語を作った Naveen Rao 氏に感謝します)と呼ぶものに重点を置いています。

Alt Intelligence とは、人間の知能と同じように問題を解決できる機械を構築することではなく、人間の行動から得られる大量のデータを活用して知能を置き換えることを意味します。現在、Alt Intelligence の主な焦点はスケーリングにあります。こうしたシステムの支持者は、システムが大規模になればなるほど、私たちは真の知性、さらには意識に近づくと主張している。

オルタナティブ・インテリジェンスを研究すること自体は何も新しいことではありませんが、それに伴う傲慢さは非常に新しいものです。

しばらくの間、現在の AI のスーパースターたち、そして実際 AI 分野全体の多くが、人間の認知を軽視し、言語学、認知心理学、人類学、哲学などの分野の学者を無視したり、嘲笑したりしている兆候が見られました。

しかし今朝、Alt Intelligence に関する新しいツイートを見つけました。このツイートの著者で、DeepMindの研究ディレクターであるNando de Freitas氏は、AIは「今や規模がすべてだ」と宣言した。実際、彼の見解では(おそらく彼の激しいレトリックは意図的に挑発的である)、AI におけるより困難な課題はすでに解決されている。 「ゲームオーバーだ!」と彼は言った。

オルタナティブ・インテリジェンスを追求することに本質的に悪いところはありません。

Alt Intelligence は、インテリジェント システムを構築する方法に関する直感 (または直感のセット) を表します。人間の知能の柔軟性と知性に匹敵するシステムを構築する方法はまだ誰も知らないため、これを実現する方法について人々がさまざまな仮説を追求するのは当然のことです。ナンド・デ・フレイタスは、この仮説を可能な限り率直に擁護しており、私はそれを「スケーリング・ウーバー・オールズ」と呼んでいます。

もちろん、名前だけではその魅力を十分に表すことはできません。デ・フレイタス氏は、モデルを大きくするだけでは成功は期待できないことをよく理解しています。最近、多くの人がスケーリングに取り組んでおり、大きな成功もあれば、障害もいくつかあります。デ・フレイタス氏が現状にどう対処しているかを詳しく検討する前に、まず現状を見てみましょう。

現状

DALL-E 2、GPT-3、フラミンゴなど ガト このようなシステムは魅力的に思えるかもしれないが、これらのモデルを注意深く研究した人なら、それを人間の知能と混同する人はいないだろう。

たとえば、DALL-E 2 は「馬に乗る宇宙飛行士」のようなテキストの説明に基づいてリアルなアートを作成できます。

しかし、テキストの説明が「青い四角形の上に置かれた赤い四角形」である場合、DALL-E によって生成された結果が左側に表示され、右側が以前のモデルによって生成された結果であるなど、驚くべき間違いを犯しがちです。明らかに、DALL-E の生成結果は以前のモデルほど良くありません。

アーネスト・デイビス、スコット・アーロンソン、そして私がこの問題を詳しく調べたところ、多くの類似した例が見つかりました。

そして、表面上は素晴らしいように見える Flamingo にもバグがあることを、DeepMind の上級研究科学者 Murray Shanahan 氏がツイートで指摘し、Flamingo の第一著者 Jean-Baptiste Alayrac 氏が後にいくつかの例を追加しました。たとえば、シャナハンはフラミンゴに次の画像を示しました。

この画像に関して、次のような誤った会話が起こりました。

それは「何もないところから」起こったように思えます。

以前、DeepMind はマルチモーダル、マルチタスク、マルチエンボディの「ジェネラリスト」エージェント Gato もリリースしましたが、細かい部分を見ると、まだ信頼できない側面が見つかります。

もちろん、ディープラーニングの擁護者は、人間は間違いを犯すと指摘するでしょう。

しかし、正直な人なら誰でも、これらのエラーが現在何かに欠陥があることを示していることに気づくでしょう。もし私の子供たちがこのような間違いを定期的に起こしていたら、私は今やっていることを全て中断して、子供たちをすぐに神経科医に連れて行くだろうと言っても過言ではありません。

正直に言うと、スケーリングはまだ機能していないが、それは可能であり、少なくとも時代精神を明確に表現したデ・フレイタスの理論はそれを示唆している。

スケーリング・ウーバー・オールズ

では、デ・フレイタスは現実と野心をどのように調和させるのでしょうか?実際、Transformer やその他多くの関連分野には数十億ドルが投資されており、トレーニング データセットはメガバイトからギガバイトに、パラメータの数は数百万から数兆にまで拡大しています。しかし、1988 年以来の多くの研究で十分に文書化されている不可解な誤りは依然として残っています。

一部の人々(私のような)にとって、これらの問題の存在は、デイビスと私が著書『Rebooting AI』で概説しているような根本的な再考に取り組む必要があることを意味するのかもしれません。しかし、これはデ・フレイタス氏には当てはまらない(他にも同じ意見の人はたくさんいるかもしれないが、彼を特別扱いするつもりはなく、ただ彼の発言の方が代表的だと思うだけだ)。

ツイートの中で、彼は現実と現在の問題を調和させることについての自身の見解を詳しく述べ、「モデルをより大きく、より安全に、より計算効率を高め、より高速なサンプリング、よりスマートなストレージ、より多くのモードにする必要がある。また、データの革新、オンライン/オフラインなどを研究する必要もある」と述べた。重要なのは、認知心理学、言語学、哲学(おそらくよりスマートな記憶はほとんど考慮されない)からの言葉が1つもないことだ。

フォローアップの投稿で、デ・フレイタス氏は次のように付け加えた。

これは「規模がすべて」という彼の発言を再確認するものであり、目標はより優れた AI ではなく、AGI であるという点を指摘しています。

AGI は、少なくとも人間の知能と同等に優れ、同等にリソースが豊富で、同等に幅広く応用できる汎用人工知能の略です。私たちが今日実現した狭義の AI は、実際には代替知能であり、その象徴的な成功例はチェス (Deep Blue は人間の知能とはまったく関係ありません) や囲碁 (AlphaGo も人間の知能とはほとんど関係ありません) などのゲームです。デ・フレイタス氏ははるかに大きな目標を持っており、その目標について非常に率直に語っているのは評価に値する。それで、彼はどうやって目標を達成するのでしょうか?繰り返しになりますが、de Freitas 氏は、より大きなデータセットに対応するために使用される技術的なツールに重点を置いています。哲学や認知科学などからのその他のアイデアも重要かもしれませんが、除外されます。

彼は「象徴の哲学は必要ない」と言った。おそらくこれは、記号操作を認知科学と人工知能に統合するという私の長年の運動に対する反論なのでしょう。このアイデアは最近、Nautilus 誌に、それほど完全ではない形ではあるものの再び登場しました。ここで簡単に返答したいと思います。「[ニューラル]ネットは[シンボル]を作成して操作するのに何の問題もない」という彼の発言は、歴史と現実の両方を無視しています。彼は、多くのニューラル ネットワーク愛好家が何十年もの間シンボルに反対してきた歴史を無視しています。また、前述の「青い立方体の上の赤い立方体」のようなシンボル記述が 2022 年でも SOTA モデルを困惑させる可能性があるという現実も無視しています。

デ・フレイタス氏はツイートの最後に、リッチ・サットンの有名な記事「苦い教訓」への賛同を表明した。

サットン氏の主張は、人工知能の進歩につながるのは、より多くのデータとより効率的なコンピューティングだけである、というものだ。私の意見では、サットンは半分しか正しくありません。過去についての彼の説明はほぼ正しいのですが、未来についての帰納的予測には説得力がありません。

これまでのところ、ほとんどの(もちろんすべてではありませんが)分野では、ビッグ データが(一時的に)慎重に設計された知識工学に勝利しています。

しかし、ウェブブラウザからスプレッドシート、ワードプロセッサに至るまで、世界のソフトウェアのほぼすべては依然として知識工学に依存しており、サットンはそれを無視している。たとえば、Sumit Gulwani の優れた Flash Fill 機能は、ビッグ データにはまったく基づいていませんが、従来のプログラミング手法に基づいて構築された、非常に便利なワンショット学習システムです。

純粋なディープラーニング / ビッグデータ システムではこれに匹敵するものはないと思います。

実際のところ、スティーブ・ピンカー、ジューディア・パール、ジェリー・フォーダー、そして私などの認知科学者が何十年も指摘してきた人工知能の主要な問題は、実際には解決されていない。はい、機械はゲームを非常に上手にプレイできますし、ディープラーニングは音声認識などの分野で大きな貢献をしてきました。しかし、現時点では、テキストを認識し、普通に話してタスクを完了できるモデルを構築できるほどの理解力を持つ AI は存在せず、また、スタートレックの映画に登場するコンピューターのように推論して一貫した応答を生成することもできません。

人工知能はまだ初期段階にあります。

特定の戦略を使用していくつかの問題を解決できたとしても、すべての問題を同様の方法で解決できるという保証にはなりません。特に、いくつかの障害モード (信頼性の低さ、奇妙なバグ、組み合わせ障害、理解不能) は、Fodor と Pinker が 1988 年に指摘して以来変わっていないのに、このことを認識しないのは愚かなことです。結論

DeepMind でさえ、Scaling-Über-Alles がまだ完全なコンセンサスになっていないのは喜ばしいことです。

私は、マレー・シャナハン氏の見解に完全に同意します。「ガトーの研究では、スケーリングだけで人間レベルの一般化に到達できると示唆するものはほとんど見当たりません。」

まだ十分に開発されていないアイデアを早まって捨てることなく、人々がさまざまな方向に仕事を進めることができるほど、オープンマインドな分野を奨励しましょう。結局のところ、(汎用)人工知能への最善の道は、Alt Intelligence の道ではないかもしれません。

先ほども述べたように、私は Gato を「代替知能」、つまり知能を構築するための代替アプローチの興味深い探求として考えたいのですが、客観的に見る必要があります。Gato は脳のようには機能せず、子供のようには学習せず、言語を理解せず、人間の価値観に適合せず、重要なタスクを完了できるとは信頼できません。

それは今私たちが持っているものよりは良いかもしれませんが、それでも実際には機能しておらず、それに多大な投資をしたにもかかわらず、一時停止する時期が来ています。

それは私たちを AI の初期の時代に戻すはずです。人工知能は人間の知能を忠実に模倣するべきではない。結局のところ、人工知能には欠陥があり、記憶力の悪さと認知バイアスを抱えているのだ。しかし、手がかりを得るためには人間と動物の認知能力に目を向けるべきです。ライト兄弟は鳥を真似したわけではないが、鳥の飛行制御から何かを学んだ。何から学ぶべきか、何から学ぶべきでないかがわかれば、成功への半分は達成できるかもしれません。

肝心なことは、かつては AI で重視されていたものの、現在は追求されていないことです。つまり、AGI を構築するのであれば、人間から何かを学ぶ必要があるということです。つまり、人間が物理世界をどのように推論し理解するか、言語や複雑な概念をどのように表現し獲得するかということです。

この考えを否定するのはおこがましいだろう。

<<:  2021年のMLとNLPの学術統計:Googleが1位、強化学習の専門家Sergey Levineが1位に

>>:  GitHubオープンソース130+スター:PPYOLOシリーズをベースにターゲット検出アルゴリズムを再現する方法をHand in handで教える

ブログ    

推薦する

「手を自由にする」は夢ではありません! AI がソフトウェア テストの未来を形作る 5 つの方法...

人工知能は今日最も注目されている流行語であり、その発展により企業や業界は情報に基づいた意思決定を行い...

Ruijie NetworksとMidea Smartは戦略的提携を結び、スマート小売端末の商業化と普及に取り組んでいます。

6月30日、瑞傑ネットワークス株式会社(以下、瑞傑ネットワークス)と合肥美的智能科技有限公司(以下...

死角なしの360度!カリフォルニア大学バークレー校、中国で3DHMフレームワークをリリース:1枚の写真であらゆるビデオアクションを模倣可能

任意のポーズの写真を入力し、写真の人物に「指定された動画」の動きを真似してもらうのは簡単ではありませ...

...

医療における AI 導入の 5 つの障壁

人間の想像力を幅広い臨床応用に活用するとなると、医療用人工知能の道のりはまだまだ長い。 [[2761...

...

2018年に人工知能がビジネスに及ぼす10のインパクト

[[220065]]人工知能 (AI) と機械学習は多くの企業にとって流行語となっていますが、これら...

...

10x Nvidia GPU: Google TPUスタートアップチームによる、モデル固有の大型チップが一夜にして有名に

モデルが GPT-3.5 のように数千億の規模に達すると、トレーニングと推論のための計算能力は一般的...

人工知能は核爆弾と同じくらい人類にとって脅威なのでしょうか? AI脅威理論の謎を解く

新たに世界一の富豪となり、テスラのCEO、そしてテクノロジー界の大物となったマスク氏は、ロボットが近...

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

先日、人工知能技術の可能性とそれに対する人々の懸念について語った際、人工知能研究会社OpenAIのC...

Apple、たった1文で写真をレタッチできる新AIモデルMGIEを披露

2月8日、マイクロソフトの急速な発展と比較すると、AppleのAI分野における展開ははるかに控えめで...

...