GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

大規模な言語モデリングにヒントを得て、Deepmind は同様のアプローチを適用し、マルチモーダル、マルチタスク、マルチ具現化を備え、600 を超えるさまざまなタスクを実行できる単一の「ジェネラリスト」エージェント Gato を構築しました。この AI は、おそらく世界がこれまでに見た中で最も印象的なオールインワンの機械学習スイートです。

DeepMindは公式ブログ投稿で次のように説明した。

「Gatoは、マルチモーダル、マルチタスク、マルチコンポーネントの汎用人工知能です。同じネットワーク条件下で、Atariゲームをプレイしたり、画像にキャプションを追加したり、人とチャットしたり、ロボットアームを制御してブロックを積み重ねたりすることができます。現在の状況に応じて、テキストを出力するか、ロボットアームを回転させるか、ボタンを押すか、その他のマークを付けるかを決定します。」

Gato のパフォーマンスがどの程度優れているかはまだ不明ですが、GPT-3 が達成できると期待できるものを超えているようです。

画像出典: DeepMind公式サイト

Gato は本当に GPT-3 を超えるのでしょうか?

GPT-3 は、資金力のある汎用人工知能 (AGI) 企業である OpenAI によって作成された大規模言語モデル (LLM) です。同社はマイクロソフトから数十億ドルの支援を受けているだけでなく、米国政府の規制も受けており、基本的に何でもできる。

同社が注力する汎用人工知能(AGI)は、人間のような知能を持ち、人間が実行できるあらゆる知的タスクを実行できるAIである。一部の研究者は、汎用人工知能を「強い AI」または「完全な AI」、あるいは一般的な知的アクションを実行する能力を持つマシンと呼んでいます。弱い AI と比較すると、強い AI は人間の認知能力を完全に備えています。

もともと、OpenAI の使命は AGI の開発と制御でしたが、現実には同社が作成できたのは非常に高度な LLM だけであり、当初の意図とは多少矛盾しています。

GPT-3 と DeepMind の Gato は素晴らしいものですが、一般の人々がそれらを評価する基準には、ある程度のニュアンスが必要です。

OpenAI が AGI への道で LLM ルートを採用している理由は単純です。AGI を機能させる方法を誰も知らないからです。火の発見から内燃機関の発明までに長い時間がかかったのと同じように、ディープラーニングから AGI に移行する方法を見つけるのも一夜にしてできることではありません。それでも、GPT-3 はテキストの生成など、人間のような動作を実行できます。

「汎用人工知能」を標榜する Gato は、GPT-3 とほぼ同じことを行います。これは、LLM と非常によく似た仕組みを単純に組み合わせて、600 以上のトリックを実行できる「マジシャン」を生み出しました。そのハイライトは、単一のシーケンス モデルを使用してすべてのタスクを解決することですが、トレーニング データの量と多様性を増やす必要があります。

Gato のマルチタスク機能は、600 通りの方法でプレイできるゲームというより、600 種類のゲームを保存できるゲーム コンソールに似ています。これは、説明されているような汎用的な人工知能ではなく、事前にトレーニングされた一連の限定されたモデルがきちんとまとめられたものです。

画像出典: DeepMind公式サイト

Knives and Paintbrushes の Mike Cook 氏は最近、TechCrunch の Kyle Wiggers 氏に次のように語っています。

「Gato のような AI が、非常に異なって聞こえるこれらのタスクをすべて実行できるのは、非常に興味深いことです。なぜなら、私たちにとって、テキストを書くこととロボットを制御することは非常に異なって聞こえるからです。

しかし実際には、これは GPT-3 が通常の英語のテキストと Python コードを理解するのとあまり変わりません。

これを実現するのは簡単ではありませんが、外部の観察者にとっては、AI がお茶を淹れたり、10 個から 50 個の他のタスクを簡単に学習したりできるように見えるかもしれませんが、実際にはそれらのいずれも実行できません。 ”

要約すると、Gato と GPT-3 はどちらも強力な AI システムですが、どちらも汎用的な知能の機能を備えていません。

AGI 時代はいつ来るのでしょうか?

DeepMindは10年以上AGIに取り組んでおり、OpenAIは2015年にスタートしました。しかし、どちらも AGI への道の最初の問題、つまりトレーニングなしで新しいことを学習できる AI の構築を解決していません。

AGI が幸運の結果であると賭けているのでなければ、これらの企業がこの分野でどのように進歩しているかを再評価する時期が来ています。

おそらく、Gato は世界で最も先進的なマルチモーダル人工知能システムかもしれません。しかし、DeepMind は、OpenAI と同様に AGI を行き詰まらせた同じ概念を採用し、それをより市場性の高いものにしたのです。

Gato はマーケティングを通じて、Alexa、Siri、Google Assistant よりも消費者市場で支持を得られる可能性があります。しかし、Gato と GPT-3 は、前述の仮想アシスタントよりも AGI へのより現実的なエントリ ポイントではありません。

これがあなたが探している AI の種類であれば、それは悪いことではありません。しかし、ガトー氏の付随研究論文には、それが AGI への足がかりになるどころか、AGI に向けて正しい方向に進んでいるという証拠はまったくありません。

<<:  Tフロントライン | テンセントAILabとの独占インタビュー:「点」から「線」へ、実験室は単なる実験以上のもの

>>:  顔認識技術の倫理

ブログ    

推薦する

パラメータは最大2兆個、GPT-4をはるかに超える!アマゾンの新型オリンパス大型モデルが公開、近日発表予定

大きなモデルの波から遠ざかっていたように見えるAmazonが、ついに最新の進捗状況を発表することにな...

...

...

データ構造とアルゴリズムの基本概念

[[361250]]この記事はWeChatの公開アカウント「bigsai」から転載したもので、著者...

AI への移行: 6 月の AI 資金調達活動の概要

情報化時代において、人工知能は急速に社会の変化と発展を推進しています。世界中の研究機関、企業、大学が...

ポピュラーサイエンス記事: GPT の背後にあるトランスフォーマー モデル

前回の記事「AIビッグモデルの解釈、トークンの理解から始める」では、最も基本的な概念である「トークン...

ディープラーニングの限界と将来

[[227297]]注: この記事は、Keras の作者である François Chollet に...

ディープラーニングのコードを信頼できるのはなぜでしょうか?

ディープラーニングは、正確性を評価するのが難しい分野です。ランダムな初期化、膨大なデータセット、重み...

...

紆余曲折の続く教育+AI。舞台裏へのシフトは、巨大企業の拡大に向けた「新たな春」となるのか?

現在、人工知能技術は多くの産業に大きな影響を与えています。その中で、近年最もホットな産業である教育は...

ジオメトリテクスチャ再構築における新しい SOTA!浙江大学がSIFUを提案:一枚の画像で高品質の3D人体モデルを再構築可能

AR、VR、3Dプリント、シーン構築、映画制作など多くの分野において、衣服を着た人体の高品質な3Dモ...

自然言語処理 (NLP) はコンピューター ビジョン (CV) よりも開発が遅く、より困難です。

[[248743]] 1. 先を行くNLP NLP 開発の歴史は非常に古く、コンピュータが発明され...

香港大学の黄凱斌氏:6G時代のエッジインテリジェンス、シャノンとチューリングの出会い

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

中国科学院、2019年の世界人工知能の発展を総合的に総括:8つの主要技術が登場し、AIはより多くの分野に浸透

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...