フェイフェイ・リーのチームはディープラーニングの「遊び場」を作った。AIも独自に進化しており、考えてみると恐ろしいことだ。

[[427578]]

動物の知能は、環境と相互作用するにつれて、その体の形に合わせて進化します。

例えば、ハムスターは猫から逃れるために、たくさんの足を持つハムスターボール（ドージ）を作り出して進化してきました。

さて、本題に戻りますが、AI もかなり賢いのですが、動物とは異なり、AI は通常シリコンベースのチップ上に実装されており、物理的な身体はありません。

では、AI に「身体」が与えられた場合、これは知能の進化にとって重要なのでしょうか?もしそうなら、それをどのように活用してよりスマートな AI を作成できるのでしょうか?

スタンフォード大学のフェイフェイ・リー氏が率いる研究チームは、コンピューターシミュレーションによる「遊び場」DERL（深層進化型強化学習）を作成した。この遊び場では、「ユニマル」と呼ばれるエージェントが絶え間ない突然変異と自然淘汰を受ける。この論文はNature Communications誌に掲載された。

https://www.nature.com/articles/s41467-021-25874-z

結果は、仮想生物の体の形が新しいタスクを学習する能力に影響を及ぼし、より困難な環境で学習し進化した形態、またはより複雑なタスクを実行する際に進化した形態は、より単純な環境で学習し進化した形態よりも速く、より良く進化することを示しています。

この研究では、最も成功した形態を持つユニマルは、当初は先代と同じ基本知能レベルであったにもかかわらず、以前の世代よりも早く課題を習得しました。言い換えれば、「具現化」こそが知能の進化の鍵なのです。

「私たちは通常、AIが人間の脳内のニューロンの機能をどのように実現するかに焦点を当てています」と、研究チームのメンバーであり、スタンフォードHAIの共同ディレクターであるフェイフェイ・リー氏は言う。「しかし、AIを物理的な実体を持つものと考えるのはまったく異なるパラダイムです。」

「われわれの知る限り、これは形態を変えることで学習を加速できることを示す初のシミュレーション実験だ」と、人文科学学部応用物理学准教授でHAIの副所長でもある研究共著者のスーリヤ・ガングリ氏は述べた。

ユニマルユニバース

チームは仮想空間を設定し、そこに単純なシミュレートされた生き物を配置しました。もちろん、これらの生き物は「ランダムに」動く「幾何学的形状」（ユニマル）にすぎません。

学習段階では平坦な地形があり、ブロック状の尾根、階段、滑らかな丘など、より困難な地形もあります。ユニマルは、変化する地形を越えてブロックを目標位置に移動する必要があります。

トレーニング後、各 Unimal は同じ環境/タスクの組み合わせでトレーニングされた他の 3 つの Unimal と競争します。勝者は、親と同じ課題に直面する前に、手足や関節の変化を伴う突然変異を起こす一匹の子孫を産みます。

最終的に、4,000 種類の異なる形態を訓練した後、チームはシミュレーションを終了しました。この時点で、生き残ったユニマルは平均 10 世代の進化を遂げており、その形態は二足歩行、三足歩行、腕のある四足歩行、腕のない四足歩行など、驚くほど多様化していました。

当初、「ほぼグラフィック」には「頭」と発達した「手足」しかなかった。奇妙な姿勢が多かった。「よろめきながら前に進む人もいれば、トカゲのように歩く人もいた。また、「タコ」を思わせる非常に面白いスタイルで手を振る人もいた。」

はぁ？いつもと同じ実験のように思えるかもしれませんが、心配しないでください。進化はまだ始まったばかりです。

これらのユニマルは、「なだらかな丘」や「低い障害物」に満ちたさまざまな惑星で成長し、より激しい環境で競争します。「逆境は成功の母である」という言葉が本当かどうか確かめてみましょう。

各環境の上位 10 名のユニマルには、「新しい障害物」からボールをゴールまで動かす、箱を丘の上に押し上げる、2 つのポイント間を巡回するといった新しいタスクが与えられました。これらの「剣闘士」たちは、まさにその仮想的な気概を見せつけました。

最終的に、「複雑な地形」を移動できるユニマルは、「平坦な地形の同類」よりも新しいタスクをより速く学習し、より優れたパフォーマンスを発揮しました。

言い換えれば、彼らは「生き残る」ことによって「進化」するのであり、「実践しながら学ぶ」ことによって「進化」するのではない。代わりに、階段、丘、尾根、移動する地形などの複雑な環境で動作するために、同時に「進化」し、「学習」します。

平地では、タコ足歩行でも同じ時間でゴールラインに到達できるかもしれませんが、丘や尾根に適した体型の方が、より速く、より安定し、最も能力が高い傾向があります。彼らの万能な身体は経験をうまく活用することができ、すぐに競争相手を圧倒するようになりました。

進化に任せましょう。

一般的な計算フレームワークである DERL は、2 つの相互作用する適応プロセスを利用して具現化されたエージェントを作成します。

進化の外側のループは、突然変異操作を通じてエージェントの形態を最適化します (b)。内側の強化学習ループは、ニューラルコントローラーのパラメーターを最適化します (c)。可変地形操作では、エージェントはボックスを初期位置 (緑色の球) から目標位置 (赤い四角) に移動する必要があります。

各環境で 3 回の進化実行 (それぞれ 4,000 モーフ) を完了した後、チームは各環境からパフォーマンスの最も優れた 10 体の Unimal を選択し、障害物の回避、ボールの操作、箱を傾斜路に押し上げるなどの 8 つのまったく新しいタスクを完了できるようにゼロからトレーニングしました。

最も成功したユニマルは、個別学習（より少ないトレーニングでより良いパフォーマンスを得る）と世代間の学習の両方でより速かった。研究チームは、先祖が人生の後半に学んだ行動が、子孫の人生の早い段階で表現される可能性があることを発見した。

さらに、10世代後、最も成功したユニマル形態は、最も初期の祖先の半分の時間で同じタスクを学習しました。

これは、19世紀後半にアメリカの心理学者ジェームズ・マーク・ボールドウィンが提唱した、適応上の利点を持つ物事を学習する能力はダーウィンの自然選択を通じて受け継がれるという仮説を裏付けるものでもある。

人間は、原子炉の中を這って廃棄物を採取したり、地震後に災害救助を行ったり、人体の中でナノロボットを誘導したり、さらには皿洗いや洗濯物を畳むといった家事を行うといった奇妙なタスクのためにロボットの体を設計する方法を必ずしも知っているわけではない。

おそらく、これらのロボットを設計する唯一の方法は、進化に任せることなのでしょう。

<<: Taとのチャットを手助けするロボットをカスタマイズする

>>: 21 世紀においてインテリジェントオートメーションは誇張されすぎているのでしょうか?

フェイフェイ・リーのチームはディープラーニングの「遊び場」を作った。AIも独自に進化しており、考えてみると恐ろしいことだ。

ユニマルユニバース

進化に任せましょう。

浅いモデルから深いモデルへ: 機械学習最適化アルゴリズムの概要

K平均法アルゴリズム Java実装クラスタ分析 681 三国志の将軍

AI インフラストラクチャスタックをわかりやすく解説し、AI プロジェクトをより迅速に展開

ICLRスポットライト！清華大学は時系列異常検出アルゴリズムを提案し、5つのSOTA結果を達成した。

LK-99「早納品、遅案内」？インドの科学者は、新しいメロンを生産するために原作者から指導を受ける：新しいサンプルは量子ロックと良好な伝導性を示す

職場でロボットが増えると、雇用に影響が出るでしょうか?

ニューラルネットワークにおけるさまざまな損失関数の紹介

7つの機械学習アルゴリズムの7つの重要なポイント

機械学習に効果的なデータを取得する方法小さなデータを扱うための 7 つのヒント (一読の価値あり)

方向を理解し、座標を伝える、Shikraはマルチモーダルな大規模モデル参照ダイアログの新しい次元を開きます

推薦する

AIセキュリティに関する隠れた懸念：ディープフェイク技術への課題と対応

2021 年に IT 自動化と AI はどこに向かうのでしょうか?

UNITのハイライト - 対話システムの技術的原理を素早く習得

2024年には、AI PCが目を見張るほど登場するでしょう。企業や消費者はどのように選択すべきでしょうか?

世界を変えた10人のアルゴリズムマスター

3Dマップナビゲーションに頼らず、自動運転技術が新たな分野に進出

GPT-4の5倍の性能を持つGoogle Geminiは、本当にOpenAIやMicrosoftに勝てるのでしょうか？

重力波検出からRNAシークエンシングまで、AIが科学的発見を加速させる方法

エッジコンピューティング、人工知能、サーマルイメージング - スマートセキュリティの未来

テレンス・タオ：私の数学的経験に基づくと、室温超伝導LK-99とその再現は非常に刺激的です

4つのディープラーニングフレームワークの紹介：初心者はどのように選択すべきか？

仮想現実プログラムを使用してテストされた人工視覚技術は、視覚障害者の自立を支援する