英国人映画監督が人工知能(AI)を使って外国映画の鑑賞方法に革命をもたらそうとしている。俳優の顔をデジタル編集し、吹き替えの言語を話しているように見せるのだ。
スコット・マン監督は、ロバート・デ・ニーロ主演の2015年のスリラー映画『オルタード』を監督したが、同映画の吹き替え版に衝撃を受けた。彼は自分自身のスタートアップを立ち上げようという意欲に駆られました。 マン氏は、顔画像をデジタルで再生する研究を行っているドイツのマックス・プランク情報科学研究所にインスピレーションを受けた。この研究がきっかけで彼は会社を設立した。同社は、俳優の頭、首、口の動きの微妙な変化を何百万回も研究し、すべてのフレームから知識を蓄積する人工知能システムを使用している。 この人工知能ツールは、映画から俳優の 2D 顔画像を抽出し、3D 画像に再現します。新しい頭部の画像には、映画の中で吹き替えられた言語を使用するときに人々の口がどのように動くかについての既存の知識が組み込まれています。このツールは、特定の言語を話す俳優の口の動きを計算し、フレームごとに新しい 3D 頭部モデルを作成します。 これが完了すると、声優の録音がシステムに取り込まれ、画像が 2D に再変換されます。その後の仕上げ作業は特殊効果チームに引き継がれた。同社が公開した映像では、映画「フォレスト・ガンプ」の映像でトム・ハンクスの唇の動きが日本語、スペイン語、ドイツ語の吹き替えのセリフとシームレスに一致している。 AIシステムは映画のすべてのフレームをスキャンし、俳優が話しているときの頭、首、口の動きを観察します。システムは俳優の独特な話し方を学習した後、俳優の頭部の 3D モデルを作成します。 次に、エンジニアは、吹き替え言語を話す人の典型的な口の動きを認識し、その特定の言語を話すときの俳優の独特な口の動きを計算できるプログラムを実行します。 新しい言語を話す声優の録音がシステムに入力されます。次に、システムは俳優の口と顔の動きが新しい言語に同期されたすべてのフレームに対して俳優の頭の新しい 3D モデルを作成し、俳優が話しているすべてのカメラアングルがカバーされるようにします。これらの画像は実写版の上に重ねられ、特殊効果チームによって最終仕上げが施されます。 |
>>: 10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました
最近の教育プロセスの中で、何人かの子供たちが私に大学で何を専攻すればいいかと尋ねました。将来的に発展...
[[263690]]さまざまな新しい人工知能技術は、古代の伝説の洪水のように、社会全体を急速に「浸水...
アリババが中国だけでなく国際的にも素晴らしいインターネット企業であることは誰もが知っています。しかし...
ソフトウェア開発の世界では、AI ツールの人気が高まっています。昨年、GitHub は、AI 支援ツ...
[[441326]]リンクリストの交差LeetCode の問題へのリンク: https://leet...
[[211637]]リカレント ニューラル ネットワーク (RNN) は、レイヤー内に重み付けされた...
チップ不足と疫病の影響により、今年初めから自動運転産業の発展は減速を余儀なくされたが、数ヶ月の回復期...
金融サービス業界は、特定の金融プロセスに不可欠なレガシー機器やシステムを使用しているため、他の業界に...
人工知能の急速な発展の背後には、大手メーカー間の秘密戦争の始まりがあります。誰もが開発者をめぐって競...
テンセントは9月18日、同社の公式アカウント「Tencent Open Source」において、オー...
OpenAI は、ますます深刻化する GPT-4 の遅延問題に正式に対応しました。私は今でもChat...
プロンプトは、中国語ではプロンプトワードと翻訳でき、大規模なモデルが特定のコンテンツを生成するように...
表現学習では、半教師あり学習と自己教師あり学習の特定の機能を通じて、モデルのトレーニングに必要なデー...