2Dを3Dにするには、たった2枚の写真だけが必要です。このAIは、ろうそくを吹き消すプロセスを想像することができます。第一著者と第二著者はともに中国人です。

2Dを3Dにするには、たった2枚の写真だけが必要です。このAIは、ろうそくを吹き消すプロセスを想像することができます。第一著者と第二著者はともに中国人です。

廃棄フィルム2枚がパチンと貼り合わされました!

見逃した素晴らしい瞬間をすぐに蘇らせることができ、効果も2Dから3Dにアップグレードできます。

見てください、小さな男の子のかわいい笑顔がすぐに現れます。

誕生日ケーキのろうそくを吹き消す瞬間も再現されました。

笑う過程はすごく癒される〜

私たちが言いたいのは、今度はカメラに残されたいたずらっ子や毛むくじゃらの子供たちの無駄な写真が、ようやく救われるということです!

そして、それがポストプロダクション合成の結果であることがわかる方法はなく、まるでオリジナルで撮影されたかのようです。

これは、Google、コーネル大学、ワシントン大学の最近の共同成果です。類似した写真 2 枚のみを使用して 3D の瞬間を復元することができ、CVPR 2022 に含まれています。

この論文の第一著者と第二著者はともに中国人で、第一著者は浙江大学を卒業している。

2枚の写真を使って、中間のシーンを前後に予測します。

この方法は、連続撮影によって作成された一連の写真など、2 枚の写真が非常に似ている場合に適しています。

この方法の鍵となるのは、2 枚の画像を特徴ベースの階層化深度画像 (LDI) のペアに変換し、シーン フローによって強化することです。

全体のプロセスでは、2 枚の写真をそれぞれ「開始点」と「終了点」と見なし、2 枚の写真の間のあらゆる瞬間の変化を徐々に予測することができます。

具体的には、次のプロセスになります。

まず、ホモグラフィ行列を使用して 2 枚の写真の位置合わせを行い、2 枚の写真の密な深度マップをそれぞれ予測します。

次に、各 RGBD イメージはカラー LDI に変換され、背景の遮蔽された部分は奥行き知覚によって修復されます。

このうち、RGB 画像は、通常の RGB 画像 + 深度画像です。

次に、2次元特徴抽出器を使用してLDIの各カラーレイヤーを修復し、特徴レイヤーを取得し、2つの特徴レイヤーを生成します。

次のステップは、シーンの動きをシミュレートすることです。

2 つの入力画像間の深度と光学フローを予測することで、LDI 内の各ピクセルのシーン フローを計算できます。

2 つの画像の間に新しいビューをレンダリングして 3D にアップグレードする場合は、特徴値を持つ 2 セットの LDI を 3D ポイント クラウドのペアにアップグレードし、シーン フローに沿って中間の時点まで双方向に移動する必要があります。

次に、3 次元の特徴点が投影および拡張され、前方および後方の 2 次元の特徴マップと対応する深度マップが形成されます。

最後に、これらのマッピングはタイムライン内の対応する時点の重みと線形に混合され、その結果が画像合成ネットワークに渡されて最終的な効果が得られます。

実験結果

データの観点から見ると、この方法はすべてのエラー指標においてベースライン レベルよりも高くなっています。

UCSDデータセットでは、この方法により、(d)に示すように、画像の詳細をより多く保存できます。

NVIDIA データセットでのアブレーション実験では、この方法がレンダリング品質の向上に効果的であることが示されています。

ただし、いくつか問題があります。2 つの画像間の変化が大きい場合、オブジェクトが間違った場所に配置されます。

例えば、下の写真では、ワインボトルの口が動いてしまい、変化しないはずのワイングラスも揺れ始めました。

また、写真に全域が写っていないと、下の写真のコアラに餌をあげている手のように、合成時にどうしても「切断」が生じてしまいます。

論文の宛先:

https://3d-moments.github.io/

<<:  製造業におけるコンピューター ビジョン: 機会と導入のヒント

>>:  物理学と機械学習が出会うとき: 物理学の知識に基づく機械学習のレビュー

ブログ    

推薦する

...

RSA-PSSアルゴリズムを一緒に学びましょう

[[400577]] AS(5): RSA-PSSアルゴリズムの紹介2018 年にリリースされた T...

スマート充電インフラ: 電気自動車の充電における人工知能の貢献

政府の電気自動車推進のビジョンに後押しされ、電気自動車業界はここ数年で大きな勢いを増しています。さら...

人工知能の10の典型的な応用分野とその技術原理の詳細な説明

この記事では、「アルゴリズム」という単語を非常に簡略化して使用し、単一のアルゴリズム、モデル、または...

...

未来はここにあります。人工知能がもたらすリスクをどう軽減できるでしょうか?

この新しい時代に成功するには、企業のセキュリティは AI がもたらすリスクを軽減し、AI がもたらす...

2年後には「ロボット」が人間の活動の80%以上をこなすようになるのでしょうか? AIに関する専門家の見解を聞く

写真:人工知能カンファレンスフォーラム 撮影:新民晩報主任記者 劉欣 「私は生産性を変革し、新しい...

なぜ人工知能にはブロックチェーンが必要なのでしょうか?

この記事では、人工知能にブロックチェーンが必要な理由、人工知能がブロックチェーンに与える影響、ブロッ...

見逃せない主流の AI チャットボット プラットフォーム 11 選

人工知能チャットボットはユーザーエクスペリエンスに革命をもたらしました。ロボットはユーザーが必要とす...

最初のソフトウェア特許取得者は93歳で亡くなった。彼はソフトウェアの知的財産権保護を獲得した。

世界初のソフトウェア特許を保有していた人物が亡くなった。彼の名前はマーティン・アルビン・ゲッツで、「...

...

次世代モバイルコンピューティングの予測

テクノロジーは前例のない速度で進歩しており、モバイル コンピューティングの将来は変革的な進歩を約束し...

AI給与動向:給与が急上昇中!

AI プログラマーの平均給与は約 10 万ドルから 15 万ドルですが、大金を稼ぐには AI エン...

13 のインテリジェントなインタラクティブ AI チャットボット プラットフォーム

[[399108]] [51CTO.com クイック翻訳]ご存知のとおり、チャットボットは企業のサー...