真の人工知能から私たちはどれくらい遠いのでしょうか?

真の人工知能から私たちはどれくらい遠いのでしょうか?

DeepMind がまた別の「悪役」を生み出しました!

[[428779]]

これらの小人たちは、アメリカの人工知能技術研究所によって作成された「知的存在」ですが、ゲームの中でしか見ることができません。世界囲碁チャンピオンのイ・セドルを4対1で破ったAlphaGoは、この研究室で訓練されたインテリジェントエージェントです。

しかし、皆さんが知らないかもしれないのは、「DeepMind」が「チェスの名人」、「サッカー選手」、「eスポーツ選手」も育成し、「人工生命」という概念まで提唱しているということです。

最近のエージェントのこのグループは、実際にリアルタイムでデータ供給をバイパスし、オープンなタスク環境で独自に進化することができます。

これまでの AlphaGo や AlphaStar がいかに強力であったとしても、異なるゲームでしかその動きを繰り出すことができず、自身のゲームの範囲を超えると、すぐに「困った状況」に陥ってしまいます。しかし、これらの小さなキャラクターは、さまざまなゲームで簡単に目標を達成することができ、非常に強力で幅広い能力を発揮します。人工知能技術が、広範囲に広がる「難題」を解決するための一歩を踏み出す可能性はあるだろうか?

ピラミッドのような戦闘要塞では、異なる色の 2 人の小人が異なる能力を持っています。跳ね返す機能がないので、彼らは怒り始め、物を投げ始めました。混乱の中、彼は木の板の1枚を「投げて」屋内階段に変え、そのまま車で突入し、ミッションを完了しました!

数回の実験の後、これらの小人たちはこの方法を繰り返すことができることがわかりました。この知的体集団には記憶力があるのでしょうか?

特筆すべきは、この小男が「スピード」も学んだことです。「引き上げられないなら、君が出てこい」。ボードを頼りにすぐにターゲットを引き抜くのです!ゲームに勝つために、何人かの小男が互いに協力することを学び、チームの強さが瞬時に高まりました。

仮想ゲーム内で自ら進化するこのようなインテリジェントエージェントは、タスク環境を人工的に構築し、大量のタスク目標を設計し、最適化されたディープラーニング手法を使用し、段階的にレベルをクリアするだけで、最終的に「十八の武術」を備えたインテリジェントエージェントになります。

サンプルと経験がなければ、これらのエージェントはどのように進化するのでしょうか? ゼロサンプルの教授法は、これらのエージェントがすでに主要な「自己学習概念」を持っていることを意味しますか?

社会発展のためのダーウィンの訓練場

これまで作られたAIサッカー場と比べると、今回の知能体の訓練場は、無数のゲームルームを備えたゲーム「社会」に似ています。各ルームのゲームは、競争、安定性、グラインド可能性、探索の難しさという4つの側面によって区別されています。

どのようなタスクであっても、このエージェント グループは最も簡単なゲームから始めて、徐々に複雑なゲームを開始できるため、ゲーム全体が仮想社会のような感じになります。

このようなインテリジェントエージェントは、ビッグデータのトレーニングを必要とせず、ゲームをプレイするたびに成長し、さまざまな条件との相互作用と「報酬」の中で、より人間の「生活」に近い、より一般的なインテリジェントエージェントに成長します。

知能体が自ら進化できるようにするための鍵は、その本来の知能と進化の原理を適切に設計することです。最初は比較的単純でしたが、複雑な構造はすべて進化しました。赤ちゃんが子供を産めないのと同じように、タスクを割り当てる際の中核的な内容は、インテリジェントエージェント自体の改善能力を超えないことです。

DeepMind によると、各 AI エージェントは 4,000 のゲーム ルームで約 70 万種類のゲームをプレイし、340 万のタスクにわたって 2,000 億回のトレーニング サイクルを経たとのことです。 1億歩はおよそ30分の練習に相当します。このトレーニング方法によれば、「成人」のインテリジェントエージェントのグループは 41 日間でトレーニングできます。

考えるのは簡単ではないかもしれない

DeepMindは、「個々のAIエージェントは、1つの目標だけでなく、複数の目標を達成するための知能を開発できる」と述べた。

AIエージェント技術企業パスマインドCEOのクリス・ニコルソン氏も「彼が学んだスキルは他の状況にも応用できる。例えば、エージェントが這って物体を制御することを学べば、ハンマーで叩いたりキルトを畳んだりといった作業を完了できる。ディープマインドはプログラミングを使ってこの世界でAIエージェントに目標を設定しており、これらのAIエージェントは目標を一つずつ習得する方法を学んでいる」と語った。

しかし、フロリダ大学のコンピューターサイエンスの准教授サティアナラヤ・ラガヴァチャリ氏は、これらのエージェントは身体感覚、時間感覚、そして目標の理解力を持っていることから、特に「生命」とはみなせないと述べた。

「AI技術は言うまでもなく、私たち人間でさえも自分の体について完全には認識していません。」

人間の脳には健康な身体が不可欠であり、人間の脳が進化するためには適切な身体概念と領域に配置されなければならないと彼は述べた。 AI エージェントが日常のタスクを理解できるのであれば、最良の結果を得るためになぜ 2,000 億回のシミュレーション手順が必要になるのでしょうか?全体として、この仮想マシンによってトレーニングされた AI エージェントは、通常のものと「まったく同じ」です。

基礎理論から実践まではまだ長い道のりがある

小規模な人工知能は、コンピュータ システムで特定のタスクを実行するために「人間の行動の要素をコピー」します。たとえば、写真を分類したり、写真内のオブジェクトの位置を特定したり、オブジェクト間の境界を定義したりすることができます。

これらのシステムは特定のタスクを実行するように設計されており、問題を解決する一般的な機能はありません。

これに対し、ディープマインドが採用する「汎用人工知能」は、文脈や暗黙の意味、社会的な事例の手がかりを理解できるため、人間レベルの人工知能と呼ばれることもあり、人間を完全に凌駕できるとさえ考えられています。

しかし、行動主義と認知主義の対立と同様に、知的エージェントが問題を解決する能力を持っているかどうかは、単純に統計分析の結果として考えることはできません。観察された行動を「事後に説明」するのは得意ですが、実験室の外では、どのような行動が起こるかを「予測」することは不可能です。

<<:  興味深いアルゴリズムを知っていますか?

>>:  IDC: 欧州の人工知能への支出は2022年に220億ドルに達する

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

クロード3の「自己認識」事件が爆発、マスクはじっとしていられず、OpenAIにはバックアッププランがあることが明らかに

クロード3は発売されてから24時間以上経ちますが、今でも人々の認知をリフレッシュさせています。量子物...

...

インテリジェントプロセスオートメーションについて知っておくべきこと

インテリジェント プロセス オートメーション (IPA) とは何ですか?インテリジェント プロセス ...

サイバーセキュリティにおける言語モデルの優れた使用例 12 件

サイバーセキュリティは人工知能の最大の市場セグメントであり、過去数年間にわたってサイバーセキュリティ...

...

この AI ツールは最近、大騒ぎになっています!試してみますか?

Stable Diffusionをプレイしたことがある人は多いと思います。この製品はmjdjour...

人工知能の7つの応用シナリオ

人工知能とは、人間の行動や思考をシミュレートし、トレーニングを通じて特定の問題を解決できる機械によっ...

西アフリカの牧畜民は飢餓危機と戦うためにAIを活用

世界銀行の支援を受けて、国際非営利団体「Action Against Hunger」は人工知能を活用...

人工知能が教育分野に参入し「スマート教育」を創出

最先端の技術力に加え、人工知能は教育分野にも進出し始めています。北京では先日、中国・外国教師科学教育...

...

人工知能は「新たな生産要素」である

[[186158]]何人かの経済学者に話を聞いてみれば、彼らはほぼ間違いなく、生産性の伸びの弱さが現...

A*アルゴリズムのC#実装に関する簡単な説明

もちろん、主な参照アルゴリズム ドキュメントは「http://www.vckbase.com/doc...

...

ディープQ学習ネットワーク: 仮想ゲームから現実世界のアプリケーションへのギャップを埋める

翻訳者 |李睿レビュー | Chonglou人工知能と機械学習は、ヘルスケア、金融、エネルギー、輸送...