AIを赤ちゃんのように考えさせましょう！ DeepMindの「Plato」モデルがNature誌に掲載

論文アドレス: https://www.nature.com/articles/s41562-022-01394-8

ただし、このプロジェクトについて話す前に、誰もが理解しやすいように例を挙げる必要があります。

私があなたの前にペンを持って立って、そのペンを後ろに隠したら、あなたはそのペンを見ることができないでしょうか？

しかし、ペンはまだ存在しているはずですよね?

それはとても単純な真実です。あなただけでなく、生後 2 か月の赤ちゃんでも理解できます。

しかし、その理由は非常に興味深いものです。科学者たちは、なぜ人々がこの原理を自然に理解できるのか、非常に興味を持っています。

DeepMind の物語は、この単純な好奇心から始まります。

赤ちゃんは何も理解できないと思いますか？

「後ろにペンは見えないが、それでもそこにある」というのは、物理学における無数の常識の 1 つに過ぎないが、DeepMind の科学者たちは、物理学における常識を AI と赤ちゃんで比較できるようにしたいと考えている。

プリンストン大学のルイス・ピロト氏とその同僚は、物理世界の常識的な法則を理解できるディープラーニングAIシステムを開発した。

このようにして、将来のコンピュータモデルは人間の思考をよりよく模倣し、赤ちゃんと同じ認知能力を持つモデルで問題を解決できるようになります。

一般的に言えば、あらゆる AI モデルは白紙の状態から始まり、さまざまな例を使用してモデルをトレーニングします。データと例の入力を通じて、モデルは知識を生成します。

しかし、科学者たちは、これは赤ちゃんには当てはまらないと指摘しています。

赤ちゃんはゼロから物事を学ぶのではなく、客観的な物事についてある程度の予測を持って生まれます。

上記の隠されたペンの例を見てみましょう。赤ちゃんは、ペンが隠されていてもそこにあることを本能的に知っています。

これが次の実験の根底にあるロジックです。つまり、赤ちゃんは成長するにつれて正しい方向へ導くいくつかの基本的な前提を持って生まれ、経験を積むにつれてその知識はますます洗練されていきます。

これにより、Piloto チームに啓示がもたらされました。

ピロト氏は、赤ちゃんの行動パターンを模倣するディープラーニング AI が、白紙の状態から始めて純粋に経験を通じて学習する AI モデルよりも優れたパフォーマンスを発揮するかどうか疑問に思いました。

研究者らはさらに2つの異なるモデルを比較した。

彼らはまず伝統的な方法（白紙と呼ばれる）を使用しました。彼らは、斜面を滑り落ちるブロックや壁に跳ね返るボールなど、学習対象となるオブジェクトの視覚的なアニメーションを AI モデルに与えました。

AIモデルはこれらのアニメーションの動きのパターンを検出し、研究者らはモデルが他のオブジェクトの動きの結果を予測できるかどうかをテストし始めました。

一方、赤ちゃんを模倣する人工知能モデルには、最初からいくつかの「原理」があり、これらの「原理」の源は、物体の動きや相互作用に関する赤ちゃんの生来の仮定です。

簡単な例を挙げると、赤ちゃんは 2 つの物体が互いを通り抜けることはできないこと、物体が空中から浮かび上がることはできないことなどを知っています。

幼児の認知を模倣するAI「プラトン」

実は、赤ちゃんが本能的に知っている物理常識は、上記2点だけではありません。完全版は以下の5点です。

1. 連続性: 物体はある場所から別の場所にテレポートするのではなく、時間と空間内で一定の連続した経路をたどります。

2. オブジェクトの持続性: オブジェクトは視界から外れても消えません。

3. 堅牢性: 物体は互いに貫通しません。

4. 不変性: オブジェクトのプロパティ (形状など) は変化しません。

5. 方向性慣性: 物体の運動の経路は慣性の原理と一致します。

これら 5 つの認識に基づいて、赤ちゃんにマジックを披露して、彼らの先入観に反する何かが起こった場合、彼らはあなたがトリックをやっていることを理解し、また、直感に反する現象が実際のところではないことも理解します。

しかし、赤ちゃんは年長児ほど知識が豊富ではありません。直感に反する現象を長い間観察し、自分のあらかじめ設定された認識と比較し、最終的に誰かが手品をしているという結論に達します。

そういえば、以前とても人気があった動画を思い出さずにはいられません。両親がベッドのシーツの後ろに隠れて、シーツを何度も上下に振った後、シーツの後ろに隠れて、すぐに部屋の奥に隠れるという動画です。シーツが消えた後も赤ちゃんが両親の姿が見えない場合、赤ちゃんはしばらくそこに立ち尽くし、両親はどこに行ったのだろうと思うでしょう。

ここでもう一つ興味深い点があります。つまり、直感に反する現象を見た後、赤ちゃんは「驚き」を表現するのです。これは当然のことのように聞こえますが、研究者たちはこのユニークな行動を AI で再現しました。

これらを踏まえて、実験結果を見てみましょう。

Piloto が設計した AI モデルは、PLATO (Physics Learning through Auto-encoding and Tracking Objects)、または「Plato」と呼ばれています。

PLATO は、物体が単純な動きをする様子を示す約 30 時間のビデオでトレーニングされ、その後、さまざまな状況でのこれらの物体の動きを予測するようにモデルがトレーニングされました。

興味深いことに、このモデルは最終的に、上記の 5 つの物理学のポイントを学習しました。

PLATO は、視聴しているビデオの中で直感に反する現象を見つけると、赤ちゃんのように、ある程度の驚きを示すこともあります。

ピロト氏とその同僚は、従来の方法（白紙）で訓練された AI モデルのパフォーマンスは良好であることを発見したが、その比較は驚くべきものだった。赤ちゃんを模倣する AI モデルである PLATO のパフォーマンスははるかに優れていました。

プリセット認識のサポートにより、後者のモデルはオブジェクトの動きをより正確に予測し、プリセット認識を新しいオブジェクト移動アニメーションに適用することができ、モデルのトレーニングに使用されるデータセットは小さくなります。

ピロトチームは、学習と経験の蓄積は重要だが、それがすべてではないという結論に達しました。

彼らの研究は、「人間に何が生まれつき備わっていて、何が学習によって得られるのか」という古典的な疑問に取り組んでいます。

次のステップは、人間についてのこの理解を AI 研究に適用することです。

ピロト氏はすでに、新しいアプローチが優れた結果をもたらすことを証明しています。