Jitu: 5秒でNeRFをトレーニングしましょう!オープンソース

Jitu: 5秒でNeRFをトレーニングしましょう!オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

Jittorフレームワークの NeRF モデル ライブラリJNeRF が正式にオープン ソースになりました。

NeRFモデルはJNeRFを使用して5秒でトレーニングできます(図1を参照)

Jittor は、Instant-NGP をサポートする最初のディープラーニング フレームワークになります。

△ 図1: 5秒でNeRFトレーニング

背景

NeRFは2020年に提案され[1]、その驚くべき視点生成効果は学術界で広く注目を集めています。

従来の明示的な表現とは異なり、NeRF はシーンを暗黙的なニューラル放射フィールドとして表現し、レンダリング中にニューラル ネットワークを通じてその場所のシーン情報を照会することで、新しい遠近法の画像を生成します。

図2: JittorフレームワークでトレーニングされたNeRFの例

NeRF の出現は革命をもたらす可能性は高いが、まだいくつかの問題が残っている。

NeRF のさまざまな部分(サンプリング、位置エンコーディング、ネットワーク構造など) を最適化するさまざまな方法により、NeRF のパフォーマンスが向上し、比較の公平性にある程度影響します。

そして、NeRF の効率が向上するにつれて、ディープラーニング フレームワークが徐々に NeRF の効率向上のボトルネックになってきました。多くの作業者が効率向上のために cuda コードを修正、追加し、さらに混乱を招いています。

したがって、NeRF では、統一されたプロセスを確立し、科学研究の効率を向上させるために、統一され、効率的で、互換性の高いモデル ライブラリが必要です。

JNeRFアーキテクチャ

JNeRF モデル ライブラリは、既存の NeRF メソッドを分析し、NeRF の主なトレーニング プロセスを図 3 に示すように7 つのモジュールにまとめます。異なるモジュールは互いに分離されているため、呼び出しや置き換えが容易です。

時間の制約により、JNeRF は現在、これらの作品のうちのごく一部しかサポートしていません。今後、JNeRF は、より多くの代表的な NeRF 作品のサポートを継続していきます。また、GitHub で JNeRF にコードを投稿していただくことも歓迎します。

△ 図3: NeRFトレーニングプロセス

JNeRFはInstant-NGPをサポート

今年初めにNvidiaのInstant-NGP[2]がリリースされて以来、学界や産業界から幅広い注目を集めており、githubのオープンソースリポジトリは現在までに7,000以上のスターを獲得しています。

この研究では、ハッシュコーディングとカスタマイズされた最適化を使用して、NeRF が5 秒で高品質の結果をトレーニングできるようにしました。

分析の結果、Instant-NGP が NeRF を 5 秒でトレーニングできるのは、ハッシュ コーディング方式だけでなく、Nvidia のハードウェアの極端な最適化によるものであることがわかりました。

図4: Instant-NGPアルゴリズムのフロー

Instant-NGP が 5 秒で NeRF をトレーニングできるという事実は、学界と産業界の両方に多くの可能性をもたらしましたが、Instant-NGP の実装にはまだいくつかの問題があります。そのソース コードは完全に Cuda ベースで記述されており、Python に慣れているユーザーにとっては敷居が高いのです。

Instant-NGP は成熟したディープラーニング フレームワークのサポートがなく、一般的に使用されているさまざまな NeRF バリアント モデルに適応できません。極限の効率最適化を追求するために、Nvidia のソース コードはさまざまな機能間の結合が厳しく、変更が困難になっています。

JNeRF に基づく Instant-NGP には、次のような利点があります。

  • 論文の速度とポイントを正確に再現しました(表1参照) 。他のディープラーニングフレームワークで再現されたInstant-NGPは、元の論文とは速度とポイントに一定のギャップがあります。Jittorは、Instant-NGPの再現に成功した世界で唯一のフレームワークです。

△ 表1: オリジナルのInstant NGPテキストとの比較

  • JNeRF は非常に効率的で、約 133 iter/s の速度でトレーニングできます。 NeRF のトレーニング速度が上がるにつれて、フレームワークの実行速度がボトルネックとなり、NeRF 速度のさらなる向上が制限されることがわかりました。最近のいくつかの研究(Plenoxel など)では、Pytorch ソースコードを大幅に変更することで高速トレーニングを実現しましたが、Instant-NGP では Cuda を直接使用して究極の速度の追求を実現しました。 Jittor の速度の利点により、JNeRF は Jittor フレームワークを直接かつ簡単に使用して Instant-NGP を再現できます。
  • Jittor はジャストインタイムコンパイルフレームワークです。ジャストインタイムコンパイル機能により、トレーニング中に Cuda コードを動的に変更するなど、元の Instant-NGP では実現できなかった多くの操作を実装できます。
  • JNeRF は適切にモジュール化されており、研究者はモジュールを簡単に呼び出して交換できます。
  • Jittor は、メタ演算子の融合と豊富なハードウェアエコロジカルサポートの利点を備えているため、Jittor ベースの JNeRF ライブラリは、国内外のさまざまなハードウェアやモバイル端末で簡単に実行できます。

JNeRF コードデモ

JNeRF では、設定ファイルを通じてモデル設定を簡単に変更できます。次のコードは、設定ファイルを変更するだけでユーザーがモジュールを置き換える方法を示しています。

現在、JNeRF リポジトリは GitHub と中国コンピューター協会の GitLink でオープンソース化されています。 JNeRF はまだ開発中であり、サポートされているモデルはまだ非常に限られています。

誰でもこのリポジトリを通じて NeRF を学習および研究し、リポジトリの改善と NeRF の開発促進に協力することができます。

GitHub リンク:

https://github.com/Jittor/JNeRF

Gitリンク:

https://www.gitlink.org.cn/jittor/jner​​f

<<:  DeepMind Google 研究者の推奨: 拡散モデルの効率と生成品質の向上のヒント

>>:  クラウド コンピューティングにおいて人工知能はどのような役割を果たすのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

未来を待つ必要はありません。分析と AI の災害はすでに起こっています。

データと機械学習アルゴリズムから得られる洞察は非常に貴重ですが、ミスは評判、収益、さらには命を奪う可...

ついに誰かが様々なStyleGANの大きな概要を作成した

[[435127]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

脚付きロボットの新たなスキル:ANYmalは山登りを学んでいる

ロボット工学の研究者がここ数年で脚付きロボットで成し遂げたことは実に驚くべきことだ。昨年7月、オレゴ...

AI チップ: なぜそれほど重要なのか?

周りを見渡せば、人工知能がいかに重要になっているかがわかるでしょう。顔認識カメラでも音声アシスタント...

元従業員が内部事情を暴露: 10年経っても、なぜGoogleはナレッジグラフを解明できないのか?

[[258183]]この記事はWeChatの公開アカウント「AI Front」(ID: ai-fr...

機械学習を利用するハッカーを心配していますか?データを盗む7つの新しい方法を知る

機械学習は、大規模なデータセットを分析してパターンを識別する能力があることで知られています。基本的に...

2021年に自動運転は私たちをどこへ連れて行くのでしょうか?

[[361430]]文/Quiu Yueye 編集/Tan Lu新年、自動運転は私たちをどこへ連れ...

今週の Github の人気プロジェクトの概要: 自然言語処理 Python ライブラリ spaCy が最もホットです!

先週、Github で最も人気のあるプロジェクトは、最近バージョン 2.0 に更新された自然言語処理...

スタンフォードNLPコースXCS224Uのビデオが公開されました。実用的な情報が満載です。ぜひ聞いてください。

会話エージェントから検索クエリまで、自然言語理解 (NLP) は今日の最もエキサイティングなテクノロ...

浅いモデルから深いモデルへ: 機械学習最適化アルゴリズムの概要

論文リンク: https://arxiv.org/abs/1706.10207概要: この論文では、...

生体認証に関する最大の誤解は何ですか?

セキュリティ分野で広く使用されている技術の中で、生体認証技術のプライバシー問題が最も懸念されています...

AIの背後にあるエンジンを理解する、テクノロジー愛好家が知っておくべき4つの機械学習アルゴリズム

人工知能は、車の運転、バーでのミキシング、戦争など、驚くべきことを行っていますが、ロボットマスクが脚...

人工知能を導入する際にプライバシーを保護するための 3 つの重要なセキュリティ対策

AI 戦略を導入する前に、企業はプライバシーを保護し、セキュリティ標準への準拠を確保するために新しい...

Matplotlib の使用が難しいと感じるのはなぜですか?このマインドマップをまだ見ていないので

序文Matplotlib は、データの視覚化を簡単に作成できる人気の Python ライブラリです。...