AIを赤ちゃんのように考えさせましょう! DeepMindの「Plato」モデルがNature誌に掲載

AIを赤ちゃんのように考えさせましょう! DeepMindの「Plato」モデルがNature誌に掲載

論文アドレス: https://www.nature.com/articles/s41562-022-01394-8

ただし、このプロジェクトについて話す前に、誰もが理解しやすいように例を挙げる必要があります。

私があなたの前にペンを持って立って、そのペンを後ろに隠したら、あなたはそのペンを見ることができないでしょうか?

しかし、ペンはまだ存在しているはずですよね?

それはとても単純な真実です。あなただけでなく、生後 2 か月の赤ちゃんでも理解できます。

しかし、その理由は非常に興味深いものです。科学者たちは、なぜ人々がこの原理を自然に理解できるのか、非常に興味を持っています。

DeepMind の物語は、この単純な好奇心から始まります。

赤ちゃんは何も理解できないと思いますか?

「後ろにペンは見えないが、それでもそこにある」というのは、物理学における無数の常識の 1 つに過ぎないが、DeepMind の科学者たちは、物理学における常識を AI と赤ちゃんで比較できるようにしたいと考えている。

プリンストン大学のルイス・ピロト氏とその同僚は、物理世界の常識的な法則を理解できるディープラーニングAIシステムを開発した。

このようにして、将来のコンピュータ モデルは人間の思考をよりよく模倣し、赤ちゃんと同じ認知能力を持つモデルで問題を解決できるようになります。

一般的に言えば、あらゆる AI モデルは白紙の状態から始まり、さまざまな例を使用してモデルをトレーニングします。データと例の入力を通じて、モデルは知識を生成します。

しかし、科学者たちは、これは赤ちゃんには当てはまらないと指摘しています。

赤ちゃんはゼロから物事を学ぶのではなく、客観的な物事についてある程度の予測を持って生まれます。

上記の隠されたペンの例を見てみましょう。赤ちゃんは、ペンが隠されていてもそこにあることを本能的に知っています。

これが次の実験の根底にあるロジックです。つまり、赤ちゃんは成長するにつれて正しい方向へ導くいくつかの基本的な前提を持って生まれ、経験を積むにつれてその知識はますます洗練されていきます。

これにより、Piloto チームに啓示がもたらされました。

ピロト氏は、赤ちゃんの行動パターンを模倣するディープラーニング AI が、白紙の状態から始めて純粋に経験を通じて学習する AI モデルよりも優れたパフォーマンスを発揮するかどうか疑問に思いました。

研究者らはさらに2つの異なるモデルを比較した。

彼らはまず伝統的な方法(白紙と呼ばれる)を使用しました。彼らは、斜面を滑り落ちるブロックや壁に跳ね返るボールなど、学習対象となるオブジェクトの視覚的なアニメーションを AI モデルに与えました。

AIモデルはこれらのアニメーションの動きのパターンを検出し、研究者らはモデルが他のオブジェクトの動きの結果を予測できるかどうかをテストし始めました。

一方、赤ちゃんを模倣する人工知能モデルには、最初からいくつかの「原理」があり、これらの「原理」の源は、物体の動きや相互作用に関する赤ちゃんの生来の仮定です。

簡単な例を挙げると、赤ちゃんは 2 つの物体が互いを通り抜けることはできないこと、物体が空中から浮かび上がることはできないことなどを知っています。

幼児の認知を模倣するAI「プラトン」

実は、赤ちゃんが本能的に知っている物理常識は、上記2点だけではありません。完全版は以下の5点です。

1. 連続性: 物体はある場所から別の場所にテレポートするのではなく、時間と空間内で一定の連続した経路をたどります。

2. オブジェクトの持続性: オブジェクトは視界から外れても消えません。

3. 堅牢性: 物体は互いに貫通しません。

4. 不変性: オブジェクトのプロパティ (形状など) は変化しません。

5. 方向性慣性: 物体の運動の経路は慣性の原理と一致します。

これら 5 つの認識に基づいて、赤ちゃんにマジックを披露して、彼らの先入観に反する何かが起こった場合、彼らはあなたがトリックをやっていることを理解し、また、直感に反する現象が実際のところではないことも理解します。

しかし、赤ちゃんは年長児ほど知識が豊富ではありません。直感に反する現象を長い間観察し、自分のあらかじめ設定された認識と比較し、最終的に誰かが手品をしているという結論に達します。

そういえば、以前とても人気があった動画を思い出さずにはいられません。両親がベッドのシーツの後ろに隠れて、シーツを何度も上下に振った後、シーツの後ろに隠れて、すぐに部屋の奥に隠れるという動画です。シーツが消えた後も赤ちゃんが両親の姿が見えない場合、赤ちゃんはしばらくそこに立ち尽くし、両親はどこに行ったのだろうと思うでしょう。

ここでもう一つ興味深い点があります。つまり、直感に反する現象を見た後、赤ちゃんは「驚き」を表現するのです。これは当然のことのように聞こえますが、研究者たちはこのユニークな行動を AI で再現しました。

これらを踏まえて、実験結果を見てみましょう。

Piloto が設計した AI モデルは、PLATO (Physics Learning through Auto-encoding and Tracking Objects)、または「Plato」と呼ばれています。

PLATO は、物体が単純な動きをする様子を示す約 30 時間のビデオでトレーニングされ、その後、さまざまな状況でのこれらの物体の動きを予測するようにモデルがトレーニングされました。

興味深いことに、このモデルは最終的に、上記の 5 つの物理学のポイントを学習しました。

PLATO は、視聴しているビデオの中で直感に反する現象を見つけると、赤ちゃんのように、ある程度の驚きを示すこともあります。

ピロト氏とその同僚は、従来の方法(白紙)で訓練された AI モデルのパフォーマンスは良好であることを発見したが、その比較は驚くべきものだった。赤ちゃんを模倣する AI モデルである PLATO のパフォーマンスははるかに優れていました。

プリセット認識のサポートにより、後者のモデルはオブジェクトの動きをより正確に予測し、プリセット認識を新しいオブジェクト移動アニメーションに適用することができ、モデルのトレーニングに使用されるデータセットは小さくなります。

ピロトチームは、学習と経験の蓄積は重要だが、それがすべてではないという結論に達しました。

彼らの研究は、「人間に何が生まれつき備わっていて、何が学習によって得られるのか」という古典的な疑問に取り組んでいます。

次のステップは、人間についてのこの理解を AI 研究に適用することです。

ピロト氏はすでに、新しいアプローチが優れた結果をもたらすことを証明しています。

しかし、ピロト氏は、PLATO は乳児の行動のモデルとして設計されたものではないと強調した。私たちは、乳児の認知方法の一部を借用して人工知能にフィードバックしているだけだ。

PLATO シミュレーション システム: フィードフォワード知覚モジュール (左) とループ ダイナミクス予測モジュール (右)

バンクーバーのブリティッシュコロンビア大学のコンピューター科学者ジェフ・クルーネ氏も、AIと人間の幼児の学習方法を組み合わせることが比較的重要な方向性であると述べた。

現在、クルーネ氏は他の研究者と協力して、物理世界を理解するための独自のアルゴリズム手法の開発に取り組んでいます。

著者について

Luis Piloto 氏がこの論文の第一著者および責任著者です。

彼は2012年にラトガース大学でコンピューターサイエンスの学士号を取得し、その後プリンストン大学に進学し、2017年に神経科学の修士号、2021年に博士号を取得しました。

2016年に彼は研究科学者として正式にDeepMindに入社しました。

<<:  赤ちゃんのように学習するディープマインド社の新モデルは、28時間で物理世界のルールを学習します

>>:  拡散+超解像モデルの強力な組み合わせ、Googleの画像ジェネレーターImagenの背後にある技術

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

マイクロソフトは、Power Platform 向け Copilot サービスの開始を正式に発表しました。これにより、AI によるアプリ開発が一文で可能になります。

マイクロソフトは10月27日、エンタープライズアプリケーションカンファレンスにおいて、ローコードプラ...

ビジュアルMambaモデルのSwinの瞬間:中国科学院、HuaweiなどがVMambaを発表

大型模型の分野におけるトランスフォーマーの地位は揺るぎない。しかし、モデルのサイズが拡大し、処理する...

人工知能は将来の建築をどのように変えるのでしょうか?

自動化された AI システムは、建物の暖房と冷房を最適化して効率性と持続可能性を向上させるのに役立ち...

Meta がテキストを音声に変換するオープンソースライブラリ AudioCraft をリリース

最近、Meta は Llama シリーズのモデルやすべてを分割する SAM モデルなど、複数の AI...

インターネット ミュージアムは大ヒットとなり、ネットユーザーの間では思い出が溢れています。あなたはいくつ思い出せるでしょうか?

インターネットの博物館を作るとしたら、どんな「コレクション」を収蔵しますか?今では、あるプログラマー...

AIと5Gテクノロジーがスマートグリッドのセキュリティ課題解決に貢献

[[334279]]この記事の主な内容:マイクログリッド、発電機、太陽光パネルなどのスマートグリッド...

...

GPT-4の予測の新たな波は、大きすぎず密度も高くないテキストのみのモデルに向けて到来している。

2020年5月、GPT-3はGPT-2の1年後に正式にリリースされました。GPT-2も、オリジナル...

顔認証ロック解除を使用するとき、携帯電話はどのようにしてあなたを「認識」するのでしょうか?顔認識について詳しく知る

2020年10月1日、私たちの祖国は71歳の誕生日を迎えました!我が国は、最初の人工衛星の打ち上げか...

人工知能が新たな領域を切り開く:バーチャルクリエイターの背後にある戦い

2011 年に Apple が Siri を発表して以来、世界最大のテクノロジー企業は現実世界の仮想...

メディア業界の自動化をリードする10のAI分野

データ爆発の時代では、データの収集だけでは不十分です。ビジネスを運営し、成長させるための洞察を得るに...

...

...

人工知能は企業で実用化されつつある

AI は、従来のプロセスや従来のテクノロジーにまき散らされた魔法の精霊ではなく、ビジネスのやり方を根...

ニューヨーク大学のチームは、自然言語を使ってチャットボットChatGPTを使ってマイクロプロセッサをゼロから設計した。

6月19日、生成型人工知能がハードウェア設計などの分野に参入し始めました。最近、ニューヨーク大学の...