GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

GPT-3を超えて、DeepMindは新しいお気に入りのGatoをリリースしましたが、「スープは変えても薬は変えない」と疑問視されています

大規模な言語モデリングにヒントを得て、Deepmind は同様のアプローチを適用し、マルチモーダル、マルチタスク、マルチ具現化を備え、600 を超えるさまざまなタスクを実行できる単一の「ジェネラリスト」エージェント Gato を構築しました。この AI は、おそらく世界がこれまでに見た中で最も印象的なオールインワンの機械学習スイートです。

DeepMindは公式ブログ投稿で次のように説明した。

「Gatoは、マルチモーダル、マルチタスク、マルチコンポーネントの汎用人工知能です。同じネットワーク条件下で、Atariゲームをプレイしたり、画像にキャプションを追加したり、人とチャットしたり、ロボットアームを制御してブロックを積み重ねたりすることができます。現在の状況に応じて、テキストを出力するか、ロボットアームを回転させるか、ボタンを押すか、その他のマークを付けるかを決定します。」

Gato のパフォーマンスがどの程度優れているかはまだ不明ですが、GPT-3 が達成できると期待できるものを超えているようです。

画像出典: DeepMind公式サイト

Gato は本当に GPT-3 を超えるのでしょうか?

GPT-3 は、資金力のある汎用人工知能 (AGI) 企業である OpenAI によって作成された大規模言語モデル (LLM) です。同社はマイクロソフトから数十億ドルの支援を受けているだけでなく、米国政府の規制も受けており、基本的に何でもできる。

同社が注力する汎用人工知能(AGI)は、人間のような知能を持ち、人間が実行できるあらゆる知的タスクを実行できるAIである。一部の研究者は、汎用人工知能を「強い AI」または「完全な AI」、あるいは一般的な知的アクションを実行する能力を持つマシンと呼んでいます。弱い AI と比較すると、強い AI は人間の認知能力を完全に備えています。

もともと、OpenAI の使命は AGI の開発と制御でしたが、現実には同社が作成できたのは非常に高度な LLM だけであり、当初の意図とは多少矛盾しています。

GPT-3 と DeepMind の Gato は素晴らしいものですが、一般の人々がそれらを評価する基準には、ある程度のニュアンスが必要です。

OpenAI が AGI への道で LLM ルートを採用している理由は単純です。AGI を機能させる方法を誰も知らないからです。火の発見から内燃機関の発明までに長い時間がかかったのと同じように、ディープラーニングから AGI に移行する方法を見つけるのも一夜にしてできることではありません。それでも、GPT-3 はテキストの生成など、人間のような動作を実行できます。

「汎用人工知能」を標榜する Gato は、GPT-3 とほぼ同じことを行います。これは、LLM と非常によく似た仕組みを単純に組み合わせて、600 以上のトリックを実行できる「マジシャン」を生み出しました。そのハイライトは、単一のシーケンス モデルを使用してすべてのタスクを解決することですが、トレーニング データの量と多様性を増やす必要があります。

Gato のマルチタスク機能は、600 通りの方法でプレイできるゲームというより、600 種類のゲームを保存できるゲーム コンソールに似ています。これは、説明されているような汎用的な人工知能ではなく、事前にトレーニングされた一連の限定されたモデルがきちんとまとめられたものです。

画像出典: DeepMind公式サイト

Knives and Paintbrushes の Mike Cook 氏は最近、TechCrunch の Kyle Wiggers 氏に次のように語っています。

「Gato のような AI が、非常に異なって聞こえるこれらのタスクをすべて実行できるのは、非常に興味深いことです。なぜなら、私たちにとって、テキストを書くこととロボットを制御することは非常に異なって聞こえるからです。

しかし実際には、これは GPT-3 が通常の英語のテキストと Python コードを理解するのとあまり変わりません。

これを実現するのは簡単ではありませんが、外部の観察者にとっては、AI がお茶を淹れたり、10 個から 50 個の他のタスクを簡単に学習したりできるように見えるかもしれませんが、実際にはそれらのいずれも実行できません。 ”

要約すると、Gato と GPT-3 はどちらも強力な AI システムですが、どちらも汎用的な知能の機能を備えていません。

AGI 時代はいつ来るのでしょうか?

DeepMindは10年以上AGIに取り組んでおり、OpenAIは2015年にスタートしました。しかし、どちらも AGI への道の最初の問題、つまりトレーニングなしで新しいことを学習できる AI の構築を解決していません。

AGI が幸運の結果であると賭けているのでなければ、これらの企業がこの分野でどのように進歩しているかを再評価する時期が来ています。

おそらく、Gato は世界で最も先進的なマルチモーダル人工知能システムかもしれません。しかし、DeepMind は、OpenAI と同様に AGI を行き詰まらせた同じ概念を採用し、それをより市場性の高いものにしたのです。

Gato はマーケティングを通じて、Alexa、Siri、Google Assistant よりも消費者市場で支持を得られる可能性があります。しかし、Gato と GPT-3 は、前述の仮想アシスタントよりも AGI へのより現実的なエントリ ポイントではありません。

これがあなたが探している AI の種類であれば、それは悪いことではありません。しかし、ガトー氏の付随研究論文には、それが AGI への足がかりになるどころか、AGI に向けて正しい方向に進んでいるという証拠はまったくありません。

<<:  Tフロントライン | テンセントAILabとの独占インタビュー:「点」から「線」へ、実験室は単なる実験以上のもの

>>:  顔認識技術の倫理

ブログ    
ブログ    

推薦する

...

ドローンは何に使えるのでしょうか?これらの使い方は本当に素晴らしいです!

ドローンは最近ますます人気が高まっています。高解像度カメラ付きの機械を数百ドルで購入することもできま...

アルゴリズムの改善とハードウェアの反復、どちらがより収益性が高いでしょうか? MITの最新の研究結果がこの答えを提供している

コンピューターが登場する前には、アルゴリズムがありました。コンピュータの誕生により、コンピュータの強...

ロボット犬をDIYするにはどれくらいの費用がかかりますか?価格は900ドルと安く、スタンフォード大学が開発し、コードはオープンソースです

たった 900 ドルで四足ロボット犬を DIY できる?スタンフォード学生ロボットクラブの新メンバー...

...

機械学習プロジェクトの 87% が失敗する 10 の理由

機械学習は、最近ニュースでよく耳にする言葉ですが、さらに多くのことを実現する可能性を秘めた技術です。...

アンサンブル法の簡単な分析

パーソナライズされた推奨システムは、金融、電子商取引、メディア、ライブ放送などの業界における Dag...

LeCun はもう一つの有名な引用を残しました: ChatGPT?犬ほども良くない!それは言語モデルによって供給されるだけである

チューリング・ビッグスリーの一人であるルカン氏は昨日、もう一つの名言を残した。 「知能の面では、Ch...

有機構造の画像を分子構造に変換するトランスフォーマーベースの人工ニューラルネットワーク

人類は人工知能の時代に突入しています。化学もまた、ニューラル ネットワークのトレーニングに大量の定性...

フォーブスの分析:深刻な問題により自動運転技術は「寒い冬」を迎える可能性がある

フォーブスによると、コーエン研究所の研究者らは最近、テスラのオートパイロットシステムへのハッキングに...

シェフとAIが協力してあなたの味覚を刺激します

[[394881]]ソニーのAIチームによると、FlavorGraphは人工知能技術を使って2つの材...

教育におけるAIの想像力と限界

広東省の有名な重点中学校である広亜中学校は最近、電子ブレスレット3,500個を購入するために485万...

データが増えるほど、AIの意思決定モデルは脆弱になる

データは人工知能システムを構築するために必要な重要なインフラストラクチャです。データは、AI システ...

...