2Dを3Dにするには、たった2枚の写真だけが必要です。このAIは、ろうそくを吹き消すプロセスを想像することができます。第一著者と第二著者はともに中国人です。

2Dを3Dにするには、たった2枚の写真だけが必要です。このAIは、ろうそくを吹き消すプロセスを想像することができます。第一著者と第二著者はともに中国人です。

廃棄フィルム2枚がパチンと貼り合わされました!

見逃した素晴らしい瞬間をすぐに蘇らせることができ、効果も2Dから3Dにアップグレードできます。

見てください、小さな男の子のかわいい笑顔がすぐに現れます。

誕生日ケーキのろうそくを吹き消す瞬間も再現されました。

笑う過程はすごく癒される〜

私たちが言いたいのは、今度はカメラに残されたいたずらっ子や毛むくじゃらの子供たちの無駄な写真が、ようやく救われるということです!

そして、それがポストプロダクション合成の結果であることがわかる方法はなく、まるでオリジナルで撮影されたかのようです。

これは、Google、コーネル大学、ワシントン大学の最近の共同成果です。類似した写真 2 枚のみを使用して 3D の瞬間を復元することができ、CVPR 2022 に含まれています。

この論文の第一著者と第二著者はともに中国人で、第一著者は浙江大学を卒業している。

2枚の写真を使って、中間のシーンを前後に予測します。

この方法は、連続撮影によって作成された一連の写真など、2 枚の写真が非常に似ている場合に適しています。

この方法の鍵となるのは、2 枚の画像を特徴ベースの階層化深度画像 (LDI) のペアに変換し、シーン フローによって強化することです。

全体のプロセスでは、2 枚の写真をそれぞれ「開始点」と「終了点」と見なし、2 枚の写真の間のあらゆる瞬間の変化を徐々に予測することができます。

具体的には、次のプロセスになります。

まず、ホモグラフィ行列を使用して 2 枚の写真の位置合わせを行い、2 枚の写真の密な深度マップをそれぞれ予測します。

次に、各 RGBD イメージはカラー LDI に変換され、背景の遮蔽された部分は奥行き知覚によって修復されます。

このうち、RGB 画像は、通常の RGB 画像 + 深度画像です。

次に、2次元特徴抽出器を使用してLDIの各カラーレイヤーを修復し、特徴レイヤーを取得し、2つの特徴レイヤーを生成します。

次のステップは、シーンの動きをシミュレートすることです。

2 つの入力画像間の深度と光学フローを予測することで、LDI 内の各ピクセルのシーン フローを計算できます。

2 つの画像の間に新しいビューをレンダリングして 3D にアップグレードする場合は、特徴値を持つ 2 セットの LDI を 3D ポイント クラウドのペアにアップグレードし、シーン フローに沿って中間の時点まで双方向に移動する必要があります。

次に、3 次元の特徴点が投影および拡張され、前方および後方の 2 次元の特徴マップと対応する深度マップが形成されます。

最後に、これらのマッピングはタイムライン内の対応する時点の重みと線形に混合され、その結果が画像合成ネットワークに渡されて最終的な効果が得られます。

実験結果

データの観点から見ると、この方法はすべてのエラー指標においてベースライン レベルよりも高くなっています。

UCSDデータセットでは、この方法により、(d)に示すように、画像の詳細をより多く保存できます。

NVIDIA データセットでのアブレーション実験では、この方法がレンダリング品質の向上に効果的であることが示されています。

ただし、いくつか問題があります。2 つの画像間の変化が大きい場合、オブジェクトが間違った場所に配置されます。

例えば、下の写真では、ワインボトルの口が動いてしまい、変化しないはずのワイングラスも揺れ始めました。

また、写真に全域が写っていないと、下の写真のコアラに餌をあげている手のように、合成時にどうしても「切断」が生じてしまいます。

論文の宛先:

https://3d-moments.github.io/

<<:  製造業におけるコンピューター ビジョン: 機会と導入のヒント

>>:  物理学と機械学習が出会うとき: 物理学の知識に基づく機械学習のレビュー

ブログ    
ブログ    

推薦する

...

...

Llama2推論: RTX3090はレイテンシとスループットで4090を上回るが、A800には遠く及ばない

大規模言語モデル (LLM) は、学界と産業界の両方で大きな進歩を遂げてきました。しかし、LLM の...

2018 年に先導するオープンソース AI プロジェクトはどれでしょうか?

[[219623]] [51CTO.com クイック翻訳] 最近では、人工知能 (AI) や機械学...

GPTストア立ち上げの裏側:民間開発者のグループが儲かり、スタートアップのグループが消滅

ノア著制作:51CTO テクノロジースタック(WeChat ID:blog)昨年末に一連の「宮廷闘争...

AIの力を借りれば、罠だらけのジムは歴史の舞台から消えるのでしょうか?

[[336650]]驚くべきことに、COVID-19の世界的大流行の中で、フィットネスやエクササイ...

ICLR 2022: AI が「目に見えないもの」を認識する方法

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

AIは病気の診断や新薬の設計に大きな可能性を秘めている

ヘルスケア業界は常にイノベーションの先駆者であり続けています。しかし、病気やウイルスが変異し続ける中...

Java プログラミング スキル - データ構造とアルゴリズム「ソート アルゴリズムの分類と紹介」

導入ソートとは、データのセットを指定された順序で並べるプロセスです。分類カテゴリ内部ソート: ソート...

Hiveテクノロジーイノベーションカンファレンスは、ドローン技術の進化とビジネスモデルの革命をリードします

2018年1月23日、北京ハイブアグロテック株式会社(以下、ハイブロボティクス)は、JDグループ本社...

学術界の巨人たちのブラックテクノロジー:人工知能のダークマターについて聞いたことがありますか?

北京大学の公式サイトの最新情報によると、元UCLA(カリフォルニア大学ロサンゼルス校)教授の朱松春...

人工知能、機械学習、認知コンピューティングの入門

何千年もの間、人々はインテリジェントな機械を構築する方法について考え続けてきました。それ以来、人工知...

180の大学が「人工知能」の専攻を追加し、人工知能は大人気です!

最近、教育部は「2019年度一般高等教育機関の学部専攻登録・認可結果発表通知」を出し、設置が認可され...