たった5秒でNeRFをトレーニング？！ Nvidia の新技術は Google の研究者の手に負えない | オープンソース

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

「これはおかしい！」

「18か月前、NeRFのトレーニングには5時間かかりました…」

「2か月前は、NeRFのトレーニングに5分しかかかりませんでした！」

「NeRFの訓練は5秒で完了する！？」

いったい何が起こったのでしょうか?これは実際に Google の研究科学者を驚かせました。

(以前人気のあった NeRF モデルを挿入します。バークレーと Google が共同で作成したもので、いくつかの静止画像から 3D のリアルな効果が生成されます)

同じようなレビューが沢山ありますよ〜

この技術を紹介するブログ記事も非常に人気があり、1日も経たないうちに数千件の「いいね！」を獲得しました。

これは NVIDIA の最新技術、つまりマルチ解像度ハッシュコーディングに基づくリアルタイムニューラルグラフィックスプリミティブであることがわかりました。

キツネの NeRF モデルのトレーニングにはわずか 5 秒しかかかりません。

さらに、このテクノロジーは NeRF をトレーニングするだけでなく、他のタスクでも驚異的なトレーニング速度を実現します。

数桁の組み合わせ高速化が達成されました。
高品質のニューラルグラフィックスプリミティブを数秒でトレーニングし、数十ミリ秒で 1920 x 1080 の解像度のグラフィックスをレンダリングできます。

単一 GPU でのリアルタイムマルチタスクトレーニング

まずは結果を見てみましょう。

ラボで目が回りそう？5分間のiPhoneビデオトレーニングで360度リアルタイムレンダリング効果を体験～

実物写真34枚を使って3D画像を再現したいですね〜

NeRF に加えて、ニューラルグラフィックスプリミティブの実装が 3 つあります。

ギガピクセル画像

著者はまた、ネットワークは最初からトレーニングされており、瞬きすると見逃してしまう可能性があることを親切に思い出させてくれます。

各ケースは tiny-cuda-nn フレームワークを使用してトレーニングおよびレンダリングされ、この実験は RTX 3090 でテストされました。

完全に接続されたネットワークによってパラメータ化されたニューラルグラフプリミティブのトレーニングと評価にはコストがかかります。

この論文では、コストを削減するために、汎用性の高い新しい入力エンコーディングを使用しています。

このエンコーディングにより、品質を犠牲にすることなく小規模なネットワークを使用できるようになり、浮動小数点数とメモリアクセスの数が大幅に削減されます。

具体的には、小さなニューラルネットワークに、トレーニング可能な特徴ベクトルのマルチ解像度ハッシュテーブルが追加されます。これらの特徴ベクトルの値は、確率的勾配降下法によって最適化されます。

つまり、このエンコーディングはタスクに依存しません。

研究チームは、ハッシュテーブルのサイズのみを変更し、すべてのタスクで同じ例とハイパーパラメータを使用したと述べています。

このプロジェクトは現在オープンソースになっており、興味のある方は以下のリンクをクリックしてください。

GitHub リンク:
https://github.com/NVlabs/instant-ngp
論文リンク:
https://nvlabs.github.io/instant-ngp/assets/mueller2022instant.pdf
プロジェクトリンク:
https://nvlabs.github.io/instant-ngp/

<<: 中国科学院は「触覚」を備えたロボットを開発し、豚の肝臓に低侵襲手術を成功させた。

>>: 改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた

AI危機の前に、この3つの資質を備えた子供たちが将来勝利するだろう

ブログ

時空間アルゴリズム研究に基づくビジネス意思決定分析

ブログ

1行のコードでsklearnの操作が数千倍高速化

ブログ

東京オリンピックでAI技術を披露：「人工」から「人工知能」へ

ブログ

ロボットは意識を獲得できるのか？もしそうなら、どうやって知るのでしょうか?

ブログ

ニューラルネットワークに基づくマルウェア検出分析

ブログ

企業がビッグデータの可能性を最大限に引き出す方法

ブログ

AT&T Business: ゼロトラストは AI アプリケーションのリスクを軽減する万能薬

ブログ

洪水の知らせを聞いたらすぐに行動を起こしましょう！ロボットは風と波の守護者となることを目指す

ブログ

人工知能は地球規模の気候危機に対処するために何ができるでしょうか?

ブログ

たった5秒でNeRFをトレーニング？！ Nvidia の新技術は Google の研究者の手に負えない | オープンソース

単一 GPU でのリアルタイムマルチタスクトレーニング

AI危機の前に、この3つの資質を備えた子供たちが将来勝利するだろう

時空間アルゴリズム研究に基づくビジネス意思決定分析

1行のコードでsklearnの操作が数千倍高速化

東京オリンピックでAI技術を披露：「人工」から「人工知能」へ

ロボットは意識を獲得できるのか？もしそうなら、どうやって知るのでしょうか?

ニューラルネットワークに基づくマルウェア検出分析

企業がビッグデータの可能性を最大限に引き出す方法

AT&T Business: ゼロトラストは AI アプリケーションのリスクを軽減する万能薬

洪水の知らせを聞いたらすぐに行動を起こしましょう！ロボットは風と波の守護者となることを目指す

人工知能は地球規模の気候危機に対処するために何ができるでしょうか?

推薦する

米軍のAIブラックテクノロジー：暗闇でも正確に顔を認識できる。これに不安を感じる人はいるだろうか？

中国の学部生が新しいAIアルゴリズムを提案：その速度はAdamに匹敵し、パフォーマンスはSGDに匹敵する

検出器を追加して、YOLOv8 を実際の戦闘に展開しましょう!

Python ニューラルネットワークで自動車保険の支出を予測する

AIは胸部X線写真からCOVID-19を検出できる

中国がテンセントやアリババなどのプラットフォーム構築に力を入れている中、日本は何をしているのでしょうか？

ガートナーは、世界の人工知能ソフトウェア市場が2022年に620億ドルに達すると予測している。

HKU がオープンソースの推奨システムの新しいパラダイム RLMRec を公開!ユーザー/製品のテキストポートレートを正確に抽出するための大規模なモデルサポート

ニューヨーク市の AI イニシアチブを分析: そこから何を学べるか?

5GとAI: 現在と未来の補完的なテクノロジー

Amazon SageMaker について

AI プロジェクトを開始する前に尋ねるべき 4 つの重要な質問

単一 GPU でのリアルタイム マルチタスク トレーニング

推薦する

単一 GPU でのリアルタイムマルチタスクトレーニング