プリンストン・インフィニゲン・マトリックスが始動! AI Creatorが爆発するほどリアルな100%自然を創造

プリンストン・インフィニゲン・マトリックスが始動! AI Creatorが爆発するほどリアルな100%自然を創造

ネオは、自分が住んでいる世界が現実ではなく、綿密に設計されたシミュレーションであることを発見します。

私たちが住んでいる世界はシミュレートされたマトリックスの世界であると思った瞬間があったでしょうか?

そして今、マトリックスが正式にオープンしました。

人類が長きにわたり暮らしてきたこの地球も、自然界のすべても幻想に過ぎないということを冷静に感じてください。

北極の氷河の上に太陽が昇ります。水中の世界には、さまざまな珍しい魚や色とりどりのサンゴ礁が満ちています。

山々には雪が降り、広大な空には鷲が舞い上がっています。灼熱の砂漠では、危険なヘビが自由に歩き回っています。

川沿いの小さな木々が燃えて煙が充満していた。

海や川は透き通っていて、ビーチでは亀がのんびりと日光浴をし、たくさんのトンボが空中で遊んでいます。

洞窟内の光と影の遊び。

雨粒が落ち、紅葉が風に舞い、時間が突然止まりました。

あなたが目にするものはすべて人工知能によって設計されています。彼らのシミュレーションは非常にリアルなので、誰もがそれを現実そのものと勘違いします。

このマトリックスのドアを開けたチームはプリンストン出身で、彼らの研究はインターネット上で瞬く間に騒動を引き起こした。

ネットユーザーたちは、私たちはマトリックスの中で生きていることが判明したと言っています。

論文の中で研究者らは、「Infinigen」と呼ばれる自然界のリアルな 3D シーン プロシージャル ジェネレーターを紹介しました。

Infinigen は、形状からテクスチャまで、すべてランダムな数学的ルールによってゼロから生成され、完全に手続き型です。

自然界の植物、動物、地形、火、雲、雨、雪などの自然現象まで、無限に変化することができます。

最新の論文がCVPR 2023に採択されました。

論文アドレス: https://arxiv.org/pdf/2306.09310.pdf

Infinigen は、同じくオープンソースである無料のオープンソース グラフィック ツール Blender 上に構築されています。

1080p の画像 2 枚を生成するのにかかる時間はわずか 3.5 時間だということは注目に値します。

無制限の履歴書データジェネレーター

プリンストン大学が提案した Infinigen は、さまざまな特定のタスクに対して現実的なシナリオを生成するように簡単にカスタマイズできます。

以下のように、自然界に見られる多様性をシミュレートします。

その最も重要な機能は、幅広いコンピューター ビジョン タスク用の無制限のトレーニング データを生成するジェネレーターとして機能することです。

これらには、オブジェクト検出、セマンティックセグメンテーション、ポーズ推定、3D 再構築、ビュー合成、ビデオ生成が含まれます。

さらに、物理ロボットや仮想具現化エージェントをトレーニングするためのシミュレーション環境の構築にも使用できます。

もちろん、3D プリント、ゲーム開発、バーチャル リアリティ、映画制作、一般的なコンテンツ作成もすべて利用可能です。

次に、Infinigen システムがどのように設計されたかを見てみましょう。

Blender のプレビュー。

研究者らは、さまざまなプリミティブとユーティリティを提供するオープンソースの 3D モデリング ソフトウェアである Blender を主に使用して手順ルールを開発しました。

Blender は、配置されたオブジェクトの階層としてシーンを表します。

ユーザーは、オブジェクトを変換したり、プリミティブを追加したり、メッシュを編集したりすることで、この表現を変更します。

Blender は、最も一般的な 3D ファイル形式のインポート/エクスポートを提供します。

最後に、Blender のすべては、Python API を介して、またはオープン ソース コードを調べることによって自動的に実行できます。

ノードトランスパイラ。

Infinigen の一環として、研究者は手順モデリングを加速するための新しいツールセットを開発しました。

注目すべき例の 1 つは、図に示すように、ノード グラフを Python コードに自動的に変換する研究者のノード コンバーターです。

結果として得られるコードはより汎用的であり、研究者は入力パラメータだけでなくグラフ構造をランダム化することができます。

このツールにより、ノード グラフの表現力が高まり、Python または C++ で直接開発された他の手続き型ルールとの統合が容易になります。

また、ノード グラフを作成することで、プログラマー以外のユーザーも Infinigen に Python コードを提供できるようになります。

ジェネレータサブシステム。 Infinigen は、確率的プログラムであるジェネレーターで構成されており、各ジェネレーターは、資産の 1 つのサブクラス (山や魚など) を生成することに特化したものです。

各ジェネレータには、ユーザーが制御できる外部の自由度を反映する一連の高レベル パラメーター (山の全体の高さなど) があります。

デフォルトでは、研究者はユーザーからの入力なしに、自然界を反映するように調整された分布に基づいてこれらのパラメータをランダムにサンプリングします。

ただし、ユーザーは研究者の Python API を使用して任意のパラメータをオーバーライドし、データ生成を細かく制御することもできます。

下の画像は地形のみを含むランダムなシーンです。研究者たちは、さまざまな自然風景の画像 13 枚を選択しました。

これらは、山、上昇する川、雪山、海岸の日の出、水中、北極の氷山、砂漠、洞窟、峡谷、浮島です。

下の画像は、煙、滝、火山の噴火シーンなど、シミュレートされた火災をランダムに生成した画像です。

葉、花、キノコ、松ぼっくり。

木、サボテン、低木。

海洋生物。

さまざまなタイプの表面。

下の図は生物の発生を示しています。

研究者らは、さまざまなゲノム(a)、体の部分(b)、体の部分のスプライシング(c)、髪(d)、体の形(e)を自動的に生成しました。

画像の右側には、研究者によってランダムに生成された肉食動物、草食動物、鳥類、甲虫類、魚類が表示されています。

下の図では、研究者がプログラムによってランダムなシーンレイアウトを作成しています (a)。

研究者らは、必要なすべての画像コンテンツ(b、各メッシュ面の色を表示するために使用)を生成し、適用されたマテリアルと変位を適用しました(c)。

最後に実画像がレンダリングされます(d)。

次の図は、動的な解像度のスケーリングを示しています。

研究者たちは、異なるカメラ距離で同じコンテンツのクローズアップメッシュ視覚化を 3 つ示しました。

メッシュ解像度が異なっていても、最終画像には変化は見られません。

実験結果

Infinigen を評価するために、研究者らは修正ステレオマッチング用のグラウンドトゥルースを含む 30,000 枚の画像ペアを作成しました。

研究者たちはこれらの画像でRAFTStereoのトレーニングを開始し、ミドルベリー検証セットとテストセットの結果を比較しました。

この研究コードは今日リリースされたばかりですが、すでに 99 個の星を獲得しています。

「ウエストワールド」のデジャブ

Nvidia の科学者 Jim Fan 氏は、現実には適切なトレーニング データがない場合、シミュレーションが次の「金鉱」になると述べています。

ここで、Infinigen は、3D ビジョン用のオープンソースで、手順的に生成されたリアルなデータセットです。品質は素晴らしいです!二つとして同じ世界はありません。

▸ 花びらの折り目まで、あらゆる細部がランダムかつカスタマイズ可能です。

▸ 自然界からのさまざまなオブジェクトとシーン:植物、動物、地形、火、雲、雨、雪。

▸ グラウンドトゥルースの自動注釈: オプティカルフロー、3D シーンフロー、深度、表面法線、パノプティックセグメンテーション、閉じた境界。

▸ Blender で書かれています。

一部のネットユーザーは、これは本当に目を開かせてくれるものだと言っていました。 Blender で 3D ワールドを手順的に生成します。 AIを使わずに、想像できるあらゆる世界を創造することができます。

このようなツールを組み合わせて世界を作成し、Daz3D などのツールでキャラクターを作成し、Blockade Labs でスカイボックスを作成し、Convai で NPC を作成します。

インフィニゲンは人工知能のコンピュータービジョン研究で役割を果たすだろうと言う人もいます。

彼は将来、人工知能があらゆることを処理するようになると信じている。

たとえば、霧の森の中に滝のある村を作りたいとします。

AI に森林の詳細な説明を書くように指示し、それを 3D ワールド ジェネレーターに送信します。

世界が生成されると、村にキャラクターを追加できます。これらの人々は人工知能によって制御され、相互作用、会話、記憶を持つようになります。

ウエストワールドのような感じ。

また、インターネット上の誰かが、手続き型生成は 20 年ほど前から存在していると主張していました (私は 15 年ほどこれをやっています)。 「No Man's Sky」は5年前の技術の良い例です。

Infinigen のハイライトは、ラベル付きデータを生成することです。このデータは AI のトレーニングに使用できます。それはおかしい。

一部のネットユーザーは、近い将来、ゲームがクレイジーになるだろうと想像しています...「独立系」ゲーム開発者がクレイジーなハイエンドコンテンツをリリースできるようになるでしょう。

Infinigen で生成された画像は非常にリアルなので、Unreal Engine で生成されたのではないかと思った人もいました。

著者について

アレクサンダー・ライストリック

Alexander Raistrick 氏は、プリンストン大学コンピューターサイエンス学部の博士課程 2 年目で、指導教官は Jia Deng 氏です。

ラハフ・リプソン

ラハフ・リプソンはプリンストン大学の博士課程3年生です。

彼の研究は、エピポーラ幾何学に関する強力な仮定を活用して、より優れた一般化とテスト精度を実現する 3D ビジョン用のディープ ネットワークの構築に重点を置いています。

ゼユ・マ

Zeyu Ma は、プリンストン大学のビジョンと学習研究室の 3 年目の博士課程の学生です。彼は2020年に清華大学で電子工学の学士号を取得しました。現在の研究は、マルチビュー 3D 再構築と手続き型データ生成に焦点を当てています。

<<:  史上最大のチューリングテスト実験が完了! 150万人が1000万回の会話に参加し、相手が人間かAIかを判断した。

>>: 

ブログ    
ブログ    

推薦する

しゃべるアバター!新しいフレームワークLipSync3Dは将来的に動的なリップシンクを可能にするかもしれない

Google AIの研究者たちは、インド工科大学カラグプル校と協力し、音声コンテンツから話すアバター...

DeepMind: 人工知能と神経科学を組み合わせて好循環を実現

最近の人工知能の進歩は目覚ましいものがあります。人工システムは、アタリのビデオゲーム、古代のボードゲ...

...

南洋理工大学華中科技大学などの最新研究:完全自動化された「即脱獄」、大型モデルだけが大型モデルを倒せる! NDSS

今年、ネットユーザーから「おばあちゃんの抜け穴」と揶揄された大規模言語モデルの「脱獄」法が大人気とな...

AIと「喧嘩」したくない?人々はどんなスマートホーム体験を望んでいるのでしょうか?

スマートホームの発展過程で、その定義は何度も変化してきました。当初のリモートコントロールの概念から、...

蘇州の路上には自動運転バスが走っている。これは試験運行ではない。市民は無料で乗車できる。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

システムと機械学習を接続するための MLOps の課題は何ですか?この記事は明らかにしている

[[418732]]機械学習は、人々がデータを利用し、データとやり取りする方法に革命をもたらし、ビジ...

...

中国と米国の人工知能の格差はどれほど大きいか:米国の人材総数は中国の約20倍

昨年上半期、メディアはかつてアンドリュー・ン氏が妻のために百度を去ったという話題を熱く議論していた。...

...

...

ディープラーニングの分野でよく使われるディープラーニングフレームワーク10選

このセクションでは、MindSpore、PaddlePaddle、PyTorch、TensorFlo...

ガートナーは、中国企業が平均5つ以上のAIユースケースを展開しているというレポートを発表した。

最近、ガートナーは中国企業が人工知能プロジェクトをプロトタイプから生産へと移行していることを示す最新...

ディープラーニングでよく使われる8つの活性化関数

活性化関数(変換関数とも呼ばれる)は、ニューラル ネットワークを設計するための鍵となります。活性化関...