GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

大規模な言語モデリングにヒントを得て、Deepmind は同様のアプローチを適用し、マルチモーダル、マルチタスク、マルチ具現化を備え、600 を超えるさまざまなタスクを実行できる単一の「ジェネラリスト」エージェント Gato を構築しました。この AI は、おそらく世界がこれまでに見た中で最も印象的なオールインワンの機械学習スイートです。

DeepMindは公式ブログ投稿で次のように説明した。

「Gatoは、マルチモーダル、マルチタスク、マルチコンポーネントの汎用人工知能です。同じネットワーク条件下で、Atariゲームをプレイしたり、画像にキャプションを追加したり、人とチャットしたり、ロボットアームを制御してブロックを積み重ねたりすることができます。現在の状況に応じて、テキストを出力するか、ロボットアームを回転させるか、ボタンを押すか、その他のマークを付けるかを決定します。」

Gato のパフォーマンスがどの程度優れているかはまだ不明ですが、GPT-3 が達成できると期待できるものを超えているようです。

画像出典: DeepMind公式サイト

Gato は本当に GPT-3 を超えるのでしょうか?

GPT-3 は、資金力のある汎用人工知能 (AGI) 企業である OpenAI によって作成された大規模言語モデル (LLM) です。同社はマイクロソフトから数十億ドルの支援を受けているだけでなく、米国政府の規制も受けており、基本的に何でもできる。

同社が注力する汎用人工知能(AGI)は、人間のような知能を持ち、人間が実行できるあらゆる知的タスクを実行できるAIである。一部の研究者は、汎用人工知能を「強い AI」または「完全な AI」、あるいは一般的な知的アクションを実行する能力を持つマシンと呼んでいます。弱い AI と比較すると、強い AI は人間の認知能力を完全に備えています。

もともと、OpenAI の使命は AGI の開発と制御でしたが、現実には同社が作成できたのは非常に高度な LLM だけであり、当初の意図とは多少矛盾しています。

GPT-3 と DeepMind の Gato は素晴らしいものですが、一般の人々がそれらを評価する基準には、ある程度のニュアンスが必要です。

OpenAI が AGI への道で LLM ルートを採用している理由は単純です。AGI を機能させる方法を誰も知らないからです。火の発見から内燃機関の発明までに長い時間がかかったのと同じように、ディープラーニングから AGI に移行する方法を見つけるのも一夜にしてできることではありません。それでも、GPT-3 はテキストの生成など、人間のような動作を実行できます。

「汎用人工知能」を標榜する Gato は、GPT-3 とほぼ同じことを行います。これは、LLM と非常によく似た仕組みを単純に組み合わせて、600 以上のトリックを実行できる「マジシャン」を生み出しました。そのハイライトは、単一のシーケンス モデルを使用してすべてのタスクを解決することですが、トレーニング データの量と多様性を増やす必要があります。

Gato のマルチタスク機能は、600 通りの方法でプレイできるゲームというより、600 種類のゲームを保存できるゲーム コンソールに似ています。これは、説明されているような汎用的な人工知能ではなく、事前にトレーニングされた一連の限定されたモデルがきちんとまとめられたものです。

画像出典: DeepMind公式サイト

Knives and Paintbrushes の Mike Cook 氏は最近、TechCrunch の Kyle Wiggers 氏に次のように語っています。

「Gato のような AI が、非常に異なって聞こえるこれらのタスクをすべて実行できるのは、非常に興味深いことです。なぜなら、私たちにとって、テキストを書くこととロボットを制御することは非常に異なって聞こえるからです。

しかし実際には、これは GPT-3 が通常の英語のテキストと Python コードを理解するのとあまり変わりません。

これを実現するのは簡単ではありませんが、外部の観察者にとっては、AI がお茶を淹れたり、10 個から 50 個の他のタスクを簡単に学習したりできるように見えるかもしれませんが、実際にはそれらのいずれも実行できません。 ”

要約すると、Gato と GPT-3 はどちらも強力な AI システムですが、どちらも汎用的な知能の機能を備えていません。

AGI 時代はいつ来るのでしょうか?

DeepMindは10年以上AGIに取り組んでおり、OpenAIは2015年にスタートしました。しかし、どちらも AGI への道の最初の問題、つまりトレーニングなしで新しいことを学習できる AI の構築を解決していません。

AGI が幸運の結果であると賭けているのでなければ、これらの企業がこの分野でどのように進歩しているかを再評価する時期が来ています。

おそらく、Gato は世界で最も先進的なマルチモーダル人工知能システムかもしれません。しかし、DeepMind は、OpenAI と同様に AGI を行き詰まらせた同じ概念を採用し、それをより市場性の高いものにしたのです。

Gato はマーケティングを通じて、Alexa、Siri、Google Assistant よりも消費者市場で支持を得られる可能性があります。しかし、Gato と GPT-3 は、前述の仮想アシスタントよりも AGI へのより現実的なエントリ ポイントではありません。

これがあなたが探している AI の種類であれば、それは悪いことではありません。しかし、ガトー氏の付随研究論文には、それが AGI への足がかりになるどころか、AGI に向けて正しい方向に進んでいるという証拠はまったくありません。

<<:  Tフロントライン | テンセントAILabとの独占インタビュー:「点」から「線」へ、実験室は単なる実験以上のもの

>>:  顔認識技術の倫理

ブログ    
ブログ    

推薦する

LK99最新ニュース:完全停止の難しさ、韓国の著者は「超伝導が唯一の可能な説明」と述べ、インドチームは3回の失敗で断念

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習にはどのような数学的基礎が必要ですか?

[[184240]]ここ数か月間、データサイエンスの世界にチャレンジして、機械学習の技術を使って統...

...

網膜症治療のAIが成熟する中、なぜ医療業界は「無反応」なのか?

網膜は人体の中で唯一、血管や神経細胞の変化を非侵襲的に直接観察できる組織であり、さまざまな慢性疾患の...

AIはオミクロン変異体の構造を1時間で予測、誤差は原子直径の半分のみ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

自動運転の 3 つの大きな問題点、つまり安全性に直接対処しますか?プレミアム?プライバシー漏洩?

2021年の上海モーターショーが終わったばかりですが、会場内外で自動運転が大きな注目を集めています...

ついに誰かがROSロボットオペレーティングシステムをわかりやすく説明しました

この記事はWeChatの公開アカウント「Big Data DT」から転載したもので、著者はZhang...

高校生たちは皆ニューラルネットワークを勉強しており、教師である私は圧倒されています

[[356670]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

ドローン技術の最新動向

ドローン分野へと私たちを導いた技術開発はそこで止まりませんでした。ドローンが軍事目的以外の目的で使用...

...

...

ディープラーニングを使用した音声分類のエンドツーエンドの例と説明

サウンド分類は、オーディオのディープラーニングで最も広く使用されている方法の 1 つです。音を分類し...

...

Baidu の計算生物学研究が Nature のサブジャーナルに掲載されました!スタンフォード大学やMITを上回る成果、製薬分野に進出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...