画像や動画の生成には AI に頼らなければならないと誰が言ったのでしょうか? プリンストン大学の新しいアーティファクトは、「AIなし」に特に重点を置いて、限りなくリアルな3D世界を生成できます。 この効果を見てみましょう: 生成されるのは単なるビデオだと思わないでください。実際は、モデリング ソフトウェア Blender に基づいて構築された完全な 3D アセット セットです。 この時点で、Blender ユーザーは全員私にこう言いました。「えっ?」 このように、パラメータを使用して詳細を制御できます。 または、対応するオプティカルフローマップ、3D シーンオプティカルフローマップ、深度マップ、パノラマセグメンテーションマップなどを取得し、さまざまな CV タスクを簡単に処理できます。 最も重要なのは、無料かつオープンソースであることです。 お母さんは、私が AI に与えるための高品質の 3D データを見つけられないことをもう心配する必要はありません... 100%ランダムな数学ベースの3DデータジェネレータAI は急速に発展しているにもかかわらず、CV 分野の多くのタスクでは、特に 3D の高品質データがまだ不足しています。 解決策の 1 つは、合成データを使用することです。このタイプのデータでトレーニングされたモデルは、ゼロショットの実際の画像でも優れたパフォーマンスを発揮することがわかりました。 問題は、既存の無料の 3D 合成データ ツールのほとんどが、自動運転関連または屋内環境にある人工物のいずれか 1 つのシナリオに限定されていることです。 そこで、特に現実世界の自然シーンを対象に範囲を広げるために、ランダムな数学的ルールに基づいてさまざまなシーンを無限に生成できるBlenderをベースにしたInfinigenを作者は作成した。 Infinigen は主に Blender の「プリミティブ」 (またはプリミティブ)を使用してプログラム ルール ライブラリを設計し、コーディングを通じて実際の自然シーン内のさまざまなオブジェクトの生成を完了します。 この論文では、主に以下の内容を含む Infinigen プログラム システムを紹介しています。
下の図に示すように、生成されるコードはより一般的なものとなり、入力パラメータとグラフ構造の両方をランダム化できるようになります。
下の図に示すように、非常にリアルな幾何学的詳細を確保できます。
また、Infinigen が FLIP を使用して動的流体をシミュレートし、Blender のパーティクル システムを使用して天候をシミュレートするのを支援しました。
または、微分成長、ラプラス成長、反応拡散を使用してさまざまなサンゴを作成し、幾何学的ノード グラフを使用して葉、花、海藻、昆布、軟体動物、クラゲを生成します。 他にも様々なサブジェネレータ(生物ジェネレータなど)がありますが、一つ一つ紹介することはしません。 これらに加えて、Infinigen には画像レンダリングおよびグラウンド トゥルース抽出プログラムも含まれており、主に以下に示すタイプの画像を生成するために使用されます。 前者の場合、システムは Blender の自然ベースのパス トレーシング レンダラー Cycles を使用して画像をレンダリングします。 著者は、Infinigen の手続き型ルールは Blender を使用して開発されたが、手続き型生成の大部分は Blender の外部で行われたと説明しています。 さらに、Infinigen の構築には膨大な量のソフトウェア エンジニアリングが必要であり、そのコード ベースのメイン ブランチだけでも40,485 行のコードが含まれているとも述べています。 最後に、Infinigen は 2 つの Intel Xeon Silver 4114 @ 2.20GHz CPU と 1 つの NVidia GPU でベンチマークされ、1080p 画像のペアを生成するのに3.5 時間のウォールタイムがかかりました。 次の表は、既存の合成データセットまたはジェネレータと比較したものです。 著者は、このことから、Infinigen の最大の利点は、外部参照リソース ライブラリなしで無制限の自然な 3D データを手順的に生成できることであり、他にはできないことであると述べています。 チームについてInfinigen は今週水曜日の CVPR カンファレンスでポスター形式でその成果を発表する予定です。 著者は全員、プリンストン大学の Vision & Learning Lab 所属です。 3人の共同筆頭著者のうちの1人は、プリンストン大学の博士課程3年生で、2020年に清華大学で電子工学の学士号を取得した馬澤宇氏です。 責任著者は、プリンストン大学コンピューターサイエンス学部の准教授である Jia Dengです。 現在、Infinigen のコードは GitHub で公開されており、わずか 2 日間で 850 個のスターを獲得しています。 論文の宛先: |
<<: すべてのオープンソースモデルを超え、クロードとバードを破り、プログラミングタスク専用の大規模モデルが登場
>>: AI人材の世界的な需要が急増、一部の職種では年間40万ドル近くを稼ぐ
悪意のある「バックドア」が埋め込まれたモデルが、何百万、何十億ものパラメータを持つモデルの中に、何者...
旅行を計画していると想像してください。 数十年前であれば、旅行先や宿泊施設の選択肢を調べたり、航空券...
人工知能(AI)は人類社会を真に知的な時代へと導くことができるのでしょうか?人工知能産業は60年以上...
[51CTO.com からのオリジナル記事] 金融テクノロジーのブームは 21 世紀以降急増してい...
【51CTO.comオリジナル記事】近年、「人工知能」(AI)という言葉が頻繁に登場し、今日ではこ...
ケーキも食べて、ケーキも残したいです! BAIR は、正確性と解釈可能性のバランスをとったニューラル...
世界がインダストリー4.0へと向かうにつれ、モノのインターネットへの世界的な支出は2022年までに1...
BT プロトコルと eMule プロトコルのアルゴリズムにはいくつかの違いがあり、この 2 つを併用...
RNA 3D 構造予測は長年の課題です。タンパク質構造予測における最近の進歩に触発され、南開大学、山...
[[385658]]この記事では、広く使用されているアルゴリズムである「ブルーム フィルター アルゴ...
AIが描いたマリリン・モンローが180°回転してアインシュタインに? !これは、最近ソーシャル メデ...
場合によっては、AI モデルはトレーニング データを超えて一般化します。人工知能の研究では、この現象...
[[380960]]私たちの周りのすべてのものが知的になることを考えたことはありますか?ガジェットは...