たった5秒でNeRFをトレーニング? ! Nvidia の新技術は Google の研究者の手に負えない | オープンソース

たった5秒でNeRFをトレーニング? ! Nvidia の新技術は Google の研究者の手に負えない | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

「これはおかしい!」

「18か月前、NeRFのトレーニングには5時間かかりました…」

「2か月前は、NeRFのトレーニングに5分しかかかりませんでした!」

「NeRFの訓練は5秒で完了する!?」

いったい何が起こったのでしょうか?これは実際に Google の研究科学者を驚かせました。

(以前人気のあった NeRF モデルを挿入します。バークレーと Google が共同で作成したもので、いくつかの静止画像から 3D のリアルな効果が生成されます)

同じようなレビューが沢山ありますよ〜

この技術を紹介するブログ記事も非常に人気があり、1日も経たないうちに数千件の「いいね!」を獲得しました。

これは NVIDIA の最新技術、つまりマルチ解像度ハッシュコーディングに基づくリアルタイム ニューラル グラフィックス プリミティブであることがわかりました。

キツネの NeRF モデルのトレーニングにはわずか 5 秒しかかかりません。

さらに、このテクノロジーは NeRF をトレーニングするだけでなく、他のタスクでも驚異的なトレーニング速度を実現します。

数桁の組み合わせ高速化が達成されました。

高品質のニューラル グラフィックス プリミティブを数秒でトレーニングし、数十ミリ秒で 1920 x 1080 の解像度のグラフィックスをレンダリングできます。

単一 GPU でのリアルタイム マルチタスク トレーニング

まずは結果を見てみましょう。

ラボで目が回りそう?5分間のiPhoneビデオトレーニングで360度リアルタイムレンダリング効果を体験~

実物写真34枚を使って3D画像を再現したいですね〜

NeRF に加えて、ニューラル グラフィックス プリミティブの実装が 3 つあります。

ギガピクセル画像

著者はまた、ネットワークは最初からトレーニングされており、瞬きすると見逃してしまう可能性があることを親切に思い出させてくれます。

各ケースは tiny-cuda-nn フレームワークを使用してトレーニングおよびレンダリングされ、この実験は RTX 3090 でテストされました。

完全に接続されたネットワークによってパラメータ化されたニューラル グラフ プリミティブのトレーニングと評価にはコストがかかります。

この論文では、コストを削減するために、汎用性の高い新しい入力エンコーディングを使用しています。

このエンコーディングにより、品質を犠牲にすることなく小規模なネットワークを使用できるようになり、浮動小数点数とメモリアクセスの数が大幅に削減されます。

具体的には、小さなニューラル ネットワークに、トレーニング可能な特徴ベクトルのマルチ解像度ハッシュ テーブルが追加されます。これらの特徴ベクトルの値は、確率的勾配降下法によって最適化されます。

つまり、このエンコーディングはタスクに依存しません。

研究チームは、ハッシュテーブルのサイズのみを変更し、すべてのタスクで同じ例とハイパーパラメータを使用したと述べています。

このプロジェクトは現在オープンソースになっており、興味のある方は以下のリンクをクリックしてください。

GitHub リンク:
https://github.com/NVlabs/instant-ngp
論文リンク:
https://nvlabs.github.io/instant-ngp/assets/mueller2022instant.pdf
プロジェクトリンク:
https://nvlabs.github.io/instant-ngp/

<<:  中国科学院は「触覚」を備えたロボットを開発し、豚の肝臓に低侵襲手術を成功させた。

>>:  改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた

ブログ    
ブログ    
ブログ    

推薦する

2年後には「ロボット」が人間の活動の80%以上をこなすようになるのでしょうか? AIに関する専門家の見解を聞く

写真:人工知能カンファレンスフォーラム 撮影:新民晩報主任記者 劉欣 「私は生産性を変革し、新しい...

...

人工知能では顔と性格の違いは分からない

中国の研究チームは、女性の外見だけに基づいてその性格特性を予測できる人工知能プログラムを立ち上げたと...

ルカン氏は罵倒し、マスク氏は笑って泣いた。9体のヒューマノイドロボットが記者会見を開いたからだ。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

わずか 2 分で、シングル ビューの 3D 生成が高速かつ良好に行えます。北京大学などが新しいRepaint123法を提案

画像を 3D に変換する方法としては、通常、スコア蒸留サンプリング (SDS) 方式が採用されていま...

人工知能がクラウド業界を変える5つの方法

サイバー攻撃の巧妙さと深刻さが増すにつれ、IT 業界は協力して、サイバー攻撃からの保護と防止に使用さ...

AI列車に乗ってみよう!マーケティングに人工知能を活用する3つの方法

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

サイバーセキュリティにおける人工知能の利用を妨げる5つの障壁

外資系サイバーセキュリティ企業サイランスは、人工知能(AI)アプリケーションの導入を阻む2つの主な障...

AIは「メイおばさん」を見つけられるのか?

[[283120]]インターネット全体が「メイおばさん」を探しているが、彼女が誰なのかは謎のままだ...

人工知能技術の発展に関する合理的な見方

[[421597]]社会の生産性が急速に発展するにつれ、文学作品に描かれた未来の技術やより良い生活が...

2020 年の AI と機械学習の重要なトレンドは何ですか?

競争が激化するテクノロジー市場において、ハイテク新興企業から世界的な多国籍企業まで、誰もが人工知能を...

レノボAmu:シーンインテリジェンスの時代に新たな「三大デバイス」を再定義

3月19日、杭州でCSHIA 2019スマートホーム業界開幕式が開催されました。ブランドメーカー、イ...

物流業界を変える7つの技術トレンド

近年、新型コロナウイルスやロシア・ウクライナ戦争、エネルギー危機など、世界規模の問題が次々と発生し、...

工業情報化部:電話ネットワークアクセスの物理チャネルに肖像マッチング技術を導入

今年12月1日より、物理チャネルでは顔認識技術対策を全面的に導入し、電話ネットワークへのアクセスプロ...

...