何が起こっているのか? アリは新しい仕事を思いついたようです—— MotionShop では、他のシーンやキャラクターを変更することなく、ビデオ内のキャラクターを 3D 画像に置き換えることができます。 たとえば、移民労働者のピグレットは太極拳を練習しています。 これを見て、待ちきれない人もいるでしょう。現在、ModelScope コミュニティで試用できます。 HuggingFace で手配したらどうかと提案する人もいましたが、そうしないと中国語がわからない人はどうなるのでしょうか? しかし、アリババが最近、多くの派手なことをやっていることは認めざるを得ません。 無料トライアルありMotionShop は現在無料トライアルが利用可能で、わずか 3 つのステップで完了します。 ビデオをアップロードし、対象オブジェクトを決定し、置き換える仮想オブジェクトを選択します。 しかし、実際にテストしてみると、いくつか注意すべき点があることがわかりました。 まず、15 秒以内のビデオをアップロードします。文字が完全で、編集できないことを確認してください。 つまり、ショット全体を 1 回の撮影で撮影する必要があり、レンズを切り替えることはできません。 次に人物を置き換えることを選択すると、オブジェクトが自動的に選択され、それがターゲット オブジェクトと一致するかどうかが確認されます。 現在、交換可能なアバターは 4 つだけです。 最後に、行列の待ち時間がかなり長いです...おそらく試す人が多すぎるからでしょう。 どうやってそれを達成するのでしょうか?アリババの研究チームは、動画内のキャラクターを3Dの人物に置き換えるフレームワークを提案した。 フレームワーク全体は 2 つの部分で構成されます。 1. 背景ビデオシーケンスを抽出および修復するためのビデオ処理パイプライン。 2. 3D キャラクター ビデオのシーケンスを生成するためのポーズ推定およびレンダリング パイプライン。 2つのパイプラインを並列に実行し、高性能レイトレーシングレンダラーTIDEを使用することで、プロセス全体を 7つのステップに分かれています。 最初のステップは文字の検出です。テキスト情報と既存のクローズドセット検出器のトランスフォーマーベースの融合を使用して、ゼロショットのオブジェクト検出を実現します。最終的なターゲット領域は、優位性選択法によって決定されました。 2 番目のステップはセグメンテーションと追跡です。ターゲットの検出に成功した後、SAM モデルの改良とアップグレードであるビデオ オブジェクトのセグメンテーションと追跡方法を使用して、ターゲット領域をピクセル レベルで追跡します。 ステップ3、修復。ビデオの残りの領域は修復されます。これには、損傷したフロー フィールドを復元するための再帰フロー完了メソッドの使用と、画像ドメインとフィーチャ ドメインの両方でのデュアル ドメイン伝播メソッドの使用による、グローバルおよびローカルの時間的一貫性の向上が含まれます。 4番目のステップは姿勢の推定です。姿勢推定法 CVFFS は、安定した人間の姿勢を推定するために使用されます。 SMPL 人体モデルは、3 次元の人体を表現するために使用されます。 ステップ 5: 3D キャラクターを生成します。推定された形状とポーズを選択した 3D モデルに再投影します。 ステップ 6: より自然でリアルな視覚効果を実現するために、さらに光の処理とレンダリングを実行し、3D モデルを元のビデオとより統合します。たとえば、TIDE エンジンを使用して新しい 3D モデルをレンダリングします。精密なマテリアル システムと組み合わせられ、モーション ブラー、時間的アンチエイリアシング、時間的ノイズ除去などのアルゴリズムによってサポートされます。 最後に、レンダリングされたイメージが元のビデオと合成され、最終的なビデオが生成されます。 興味のある方は以下のリンクをクリックしてください: https://modelscope.cn/studios/Damo_XR_Lab/motionshop/summary |
<<: OpenAIのアルトマン氏、ニューヨークタイムズの訴訟に反応: AIはニュース出版社からのトレーニングデータを必要としない
>>: 中国科学院は、プログラマーがバグを見つけるのを助けるために大きなモデルを使用し、102の論文を分析し、これらの解決策をまとめた。
IT Homeは11月16日、韓国銀行が最近、人工知能(AI)が労働市場に与える影響に関する調査報告...
AlphaGOとイ・セドルの人間対機械の戦いにより、ディープラーニングという言葉が再び人気を集めてい...
2023年10月11日、北京の黄金の秋に、第9回HAOMO AI DAYが予定通り開催されました。今...
ロボティック プロセス オートメーション (RPA) サービス プロバイダーである Blue Pri...
よく考えてみると、この質問は少し皮肉に思えます。将来、新しいクリエイター (AI) がクリエイター ...
過去20年間、一部の懐疑論者は、人工知能(AI)の発展が企業構造を混乱させ、大量の失業と富の格差の拡...
近年、人工知能への熱狂が多くの業界を席巻しており、ロボット工学の分野も例外ではありません。人工知能技...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
何十年もの間、人工知能はSFの中で邪悪な力として描かれてきました。アーサー・C・クラークの『宇宙の旅...
高速で運転していて、車がブレーキをかけられないとします。目の前の片側には段ボール箱が山積みになってい...
[[428260]]屋内環境での自己教師付き深度推定は、屋外環境でのそれよりも常に困難でした。OPP...
今日紹介するアルゴリズムは Tarjan と呼ばれていますが、これも非常に奇妙な名前です。奇妙なのは...