テイラー・スウィフトが本物の中国語を話す動画が話題になっている。ほぼ完璧な唇の動きと時間通りのパフォーマンスが特徴だ。その背後にはAIツールがあることが判明した。

テイラー・スウィフトが本物の中国語を話す動画が話題になっている。ほぼ完璧な唇の動きと時間通りのパフォーマンスが特徴だ。その背後にはAIツールがあることが判明した。

ここ2日間、アメリカ人女性歌手テイラー・スウィフトが中国語を話す短い動画が、さまざまなソーシャルプラットフォームで人気となっている。中には600万回以上再生されているものもあります。

ビデオの中で、テイラー・スウィフトは自信に満ちた表情で流暢で本格的な中国語を話している。初期の吹き替え映画のヒロインたちのアクセントはほとんどなく、唇の動きも原作と一致している。

画像出典: Weibo @会火

まだビデオを見ていない方のために、まずは簡単に見てみましょう。

ビデオ作成者: johnhuu は英語を教えています

どうですか、魔法のようじゃないですか?

テイラー・スウィフトだけでなく、レイチェル・ブロズナハン、トランプ、エマ・ワトソン、ミスター・ビーンも本格的な中国語をマスターしていることがわかります。さらに、スケッチ俳優の蔡明は土槽会議で「流暢な英語を披​​露した」。

著者は、ビデオ制作には、本物の音声翻訳の習得、音声の複製、唇の形の置き換えという 3 つの重要な要素があり、それぞれのステップをうまく実行する必要があると述べています。しかし、具体的にどのようなモデルが使用されたかは明らかにしなかった。

この動画が人気を博した後、新たな試みを始める人が増え、動画の背後で使用されている AI 生成ツール「HeyGen」についても知るようになりました。

Twitterユーザーの@Gorden_Sunも、テイラー・スウィフトが中国語を話している動画を作成した。今回は彼女の唇の動きが完璧で、タイミングと口の形がまさにその瞬間に一致していた。 「音質は実はかなり似ている」とコメントした人もいました。

作者によると、動画内の翻訳はHeyGenによって自動的に行われ、品質はあまり良くないかもしれないとのこと。動画をアップロードして、翻訳する言語を選択するだけでよいとのこと。

動画の字幕は作者自身が追加しており、HeyGenにはこの機能はありません。さらに、ビデオの登場人物は感情的な回復がまだ欠けています。

ただし、HeyGen は無料で試すことができますが、長い待ち時間が必要です。技術に精通している人は、音声テキスト変換の whisper、テキスト翻訳の GPT、サウンドの複製とオーディオ生成の so-vits-svc、オーディオと一致するリップシンクビデオを生成する GeneFace++ などのオープンソースの代替手段を探すこともできます。

中国語と英語の交流に加えて、海外では英語を日本語に翻訳する試みも行われており、結果も非常に良好です。同氏によると、このビデオもHeyGenを使用して作成されたという。

さらに驚くべきことに、HeyGen を使用して最大 6 つの異なる言語を話すビデオを作成した人もいます。 「HeyGenはコンテンツ制作の分野に破壊的変化をもたらすだろう」とコメントする人もいた。

それで、HeyGenの起源は何でしょうか?実は、この動画は2か月以上前に話題になっていたことが判明した。

HeyGen: Midjourneyと同じくらい優れたAIビデオジェネレーター

当時、HeyGenは超リアルなデジタルヒューマンを生成しており、その制作に自ら参加したのは創設者のJoshua Xu氏でした。キャラクターの表情や動き、表情などが鮮やかに映し出されます。

HeyGen のこのビデオは大きな話題を呼んでいますが、エフェクトにはまだ欠陥があるため、誰もが改良版を期待しています。

HeyGenの創設者ジョシュア・シューのAI生成デジタルヒューマンは瞬きが多すぎる

HeyGenの背後にある会社はShiyun Technologyと呼ばれ、2020年に設立されました。彼らは当初、AI デジタルヒューマン生成に専念しており、創設者の Joshua Xu 氏は Snapchat で機械学習を担当する主任エンジニアでした。

徐之尚氏はかつてブログ投稿で、2022年7月に製品が発売されてから178日後、同社のARR(年間経常収益)が100万米ドルに達したと書いた。

HeyGen は、より安価で時間を節約できるビデオ作成方法をユーザーに提供します。これにより、従来のビデオ制作における高コスト、長いサイクル、人員の煩雑さ、高い機材要件などの問題が解決されます。

<<:  あなたの GPU は Llama 2 のような大規模なモデルを実行できますか?このオープンソースプロジェクトを試してみてください

>>:  来年のIT投資の見通しは有望です。成長率はGDPの3倍です。 CIOの75%がAIへの支出を増やす

ブログ    
ブログ    

推薦する

医療提供者はなぜインテリジェントオートメーションに投資する必要があるのでしょうか?

インテリジェント オートメーション (IA) は、人工知能とオートメーションを組み合わせたものです。...

AI に携わる人が Python を選ぶ理由は何でしょうか?

AIとビッグデータの時代に、最初の開発言語となるのは誰でしょうか?これは議論の余地のない質問です。...

ファーウェイの天才少年Zhihuiは、かわいいロボットを自作し、5時間でオープンソース化し、GitHubで317個のスターを獲得した。

前回ブドウに縫い目をつけた「完全自社開発」のアイアンマンロボットアーム「ダミー」を覚えていますか? ...

JD.com、ビリビリ、ピンドゥオドゥオなど中国企業88社が米国の上場廃止前リストに含まれ、中国コンセプト株がクリアされる可能性

半月も経たないうちに、第6波がまたやってきました!現地時間5月4日、米証券取引委員会は再び「上場廃止...

...

チャットボットは過去のもの:避けられない運命…

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

人工知能が巨大な応用価値を生み出す

飛行機搭乗時の「顔スキャン」から無人スーパーマーケットまで、多機能巡回ロボットからスマート医療まで....

PHP 再帰アルゴリズムとアプリケーションの紹介

PHP は動的な Web ページを開発するための最適なテクノロジーです。プログラミングに役立つ基本的...

求人検索サイトIndeedの統計:AI採用は減速、求職者の関心は低下

6月末、わが国各省市で大学入試結果が次々と発表される中、学生の専攻選択は統計的な傾向に新たな波を起こ...

私たちの重要なインフラは人工知能に対応できるでしょうか?

ChatGPT を楽しみや機能のために使用する個人から、タスクの自動化に人工知能 (AI) を適用...

アンドリュー・ン:AIはビッグデータから「スモールデータ」に移行する時が来た

AI界の巨匠アンドリュー・ン氏が最近、新型コロナウイルスの検査で陽性反応を示し、多くのネットユーザー...

...

...

携帯電話なら何でもコピー&ペーストできる。このデザイナーはパートタイムでコードを書き、ARを新たなレベルに引き上げた。

見たものを何でもコピーします。これは魔法ですか、それとも孫悟空の魔力ですか?どちらでもない。これが ...

ロボットが任務中、「無人配達」の裏にある苦闘と暗闘

[[230225]]本レポートでは、無人配送業界の変化、その台頭理由、中国と米国の違いについて詳細に...