この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 「これはおかしい!」 「18か月前、NeRFのトレーニングには5時間かかりました…」 「2か月前は、NeRFのトレーニングに5分しかかかりませんでした!」 「NeRFの訓練は5秒で完了する!?」 いったい何が起こったのでしょうか?これは実際に Google の研究科学者を驚かせました。 (以前人気のあった NeRF モデルを挿入します。バークレーと Google が共同で作成したもので、いくつかの静止画像から 3D のリアルな効果が生成されます) 同じようなレビューが沢山ありますよ〜 この技術を紹介するブログ記事も非常に人気があり、1日も経たないうちに数千件の「いいね!」を獲得しました。 これは NVIDIA の最新技術、つまりマルチ解像度ハッシュコーディングに基づくリアルタイム ニューラル グラフィックス プリミティブであることがわかりました。 キツネの NeRF モデルのトレーニングにはわずか 5 秒しかかかりません。 さらに、このテクノロジーは NeRF をトレーニングするだけでなく、他のタスクでも驚異的なトレーニング速度を実現します。
単一 GPU でのリアルタイム マルチタスク トレーニングまずは結果を見てみましょう。 ラボで目が回りそう?5分間のiPhoneビデオトレーニングで360度リアルタイムレンダリング効果を体験~ 実物写真34枚を使って3D画像を再現したいですね〜 NeRF に加えて、ニューラル グラフィックス プリミティブの実装が 3 つあります。 ギガピクセル画像 著者はまた、ネットワークは最初からトレーニングされており、瞬きすると見逃してしまう可能性があることを親切に思い出させてくれます。 各ケースは tiny-cuda-nn フレームワークを使用してトレーニングおよびレンダリングされ、この実験は RTX 3090 でテストされました。完全に接続されたネットワークによってパラメータ化されたニューラル グラフ プリミティブのトレーニングと評価にはコストがかかります。 この論文では、コストを削減するために、汎用性の高い新しい入力エンコーディングを使用しています。 このエンコーディングにより、品質を犠牲にすることなく小規模なネットワークを使用できるようになり、浮動小数点数とメモリアクセスの数が大幅に削減されます。 具体的には、小さなニューラル ネットワークに、トレーニング可能な特徴ベクトルのマルチ解像度ハッシュ テーブルが追加されます。これらの特徴ベクトルの値は、確率的勾配降下法によって最適化されます。 つまり、このエンコーディングはタスクに依存しません。 研究チームは、ハッシュテーブルのサイズのみを変更し、すべてのタスクで同じ例とハイパーパラメータを使用したと述べています。 このプロジェクトは現在オープンソースになっており、興味のある方は以下のリンクをクリックしてください。 GitHub リンク: |
<<: 中国科学院は「触覚」を備えたロボットを開発し、豚の肝臓に低侵襲手術を成功させた。
>>: 改良された ResNet が Transformer を上回り、アーキテクチャの戦いが再燃します。著者は「革新はない」と述べた
2021年の上海モーターショーが終わったばかりですが、会場内外で自動運転が大きな注目を集めています...
2月8日、ホワイトハウス大統領府は最新の改訂版「重要かつ新興の技術」リスト(CETリスト)を発表しま...
人工知能の出現により、ますます多くの企業がそれを業務や生産に応用しています。新しいモバイル開発技術が...
本日、OpenAI は立て続けにツイートを数回送信し、「準備フレームワーク」を大々的に発表しました。...
[[390952]]人工知能 (AI) を使用して細胞の 3D 構造にラベルを付けて識別することは、...
2世紀前に折りたたまれた手紙の内容を、開かずに読むにはどうすればよいでしょうか?アルゴリズムはそれを...
わずか 2 週間で、プロジェクトのスターの数が 390 から 10,000 に増加し、Discord...
【51CTO.comオリジナル記事】 2017年12月1日から2日まで、51CTO主催のWOTDグロ...
著者 (Alex Rodriguez、Alessandro Laio) は、さまざまな形状のクラスタ...
社会の進歩と国民の意識の高まりに伴い、社会全体が女性の権利にますます注目するようになっています。 3...
数学はすべての科目の基礎であり、数学の学習には終わりがありません。ビジネスに携わっている場合、または...
2019年12月22日、中国職業技術教育学会科学技術成果転換作業委員会が中国科学院コンピューティング...
写真ビデオセグメンテーションは多くのシナリオで広く使用されています。映画の視覚効果を高めたり、自動運...
銀行が新規顧客が債務不履行になるかどうかを判断する際、債務不履行にならない顧客と債務不履行になる顧客...
[[422011]] 2013年、バハマで仕事をしていたとき、私は現在ドローンとして知られているもの...