快手テクノロジー副社長の王中元氏:ユーザーの90%はショートビデオに音楽を使用することを期待しています。快手は「AI+音楽」を使用してショートビデオの作成を支援します。

快手テクノロジー副社長の王中元氏:ユーザーの90%はショートビデオに音楽を使用することを期待しています。快手は「AI+音楽」を使用してショートビデオの作成を支援します。

6月6日、2021年世界人工知能技術大会の「発展と課題」特別フォーラムが杭州で開催された。快手テクノロジー副社長兼MMU&Y-tech代表の王中元氏がフォーラムに出席し、「音楽とテクノロジーの衝突と融合 - 時代とともにアートはどう変化するか」と題する基調講演を行い、AI音楽における快手の動向と進歩を共有し、快手の優れた人工知能技術と、AI音楽が短編動画にもたらす強力なブーストを全面的に披露した。

[[404796]]

AI技術+音楽の深い統合、Kuaishouは短編動画の視聴体験を向上し続けます

国内のショートビデオアプリであるKuaishouは、膨大なコンテンツ、膨大なトラフィック、高いユーザー定着率を誇ります。データによると、Kuaishouユーザーによって毎月平均11億本以上の短編動画がアップロードされており、1日あたりのアクティブユーザー数は全体で3億7000万人を超えています。Kuaishouプラットフォームで短編動画やライブ放送を視聴する平均時間は、1日あたり約100分です。

豊かな Kuaishou コミュニティ エコシステムでは、音楽はユーザーの創作意欲を刺激する要素の 1 つになっています。快手では、快手作品の76%にサウンドトラックがあり、快手ユーザーの90%はほとんどの短編動画にサウンドトラックがあることを期待しています。

ユーザーはなぜ短い動画を作成するときに音楽にそれほど依存するのでしょうか?王中元氏は「短編動画の制作体験にとって、音楽のプラスの影響は極めて重要です。例えば、美しい短編動画のバックグラウンドミュージックを削除し、オリジナルのサウンドだけを残すと、その雰囲気が弱まり、ユーザーに以前とは全く異なる印象を与えてしまいます」と語った。

この点に関して、王中元氏は音楽の独特な魅力をさらに分析した。彼の意見では、音楽は人々の思考や感情と結びつき、人々に幸せ、悲しみ、期待などの感情を与えることができる。中国人は春節の序曲を聞くと、春が戻ってすべてが生き返ったような気持ちになることが多く、CCTV春節祝賀会の司会者の冒頭の言葉も無意識のうちに頭に浮かびます。

音楽は魔法のような芸術であり、テクノロジーの発展とともに新たな形をとっています。産業時代においては、製造工程の改善により、楽器から発せられる音はより豊かで多層的なものになりました。エレクトロニック時代においては、電子技術の発達により、自然界の機械では作り出せない音が生み出され、音楽の表現力はより多様化しました。

人工知能の時代を迎えた今日、AIテクノロジーは音楽の包括的なパーソナライゼーションとインテリジェンスの実現を支援し、音楽と短編動画に新たな発展空間をもたらします。王中元氏によると、少し前にネット上で流行した「Ants」は、音楽と視覚AI技術の創造的な融合であり、ユーザーは写真1枚だけで、ユーモアがあり楽しくダイナミックな歌唱ビデオを自動的に生成します。魔法のようなBGMと相まって、すぐにショートビデオユーザーが急いで作成するテンプレートになりました。

AI技術が音楽の普及を促進し、快手はプロレベルの歌唱を復活させる独自のモデルを構築

テクノロジーの助けにより、音楽制作は大衆化の時代に入りました。より多くのユーザーがパーソナライズされた音楽を作成できるようにするにはどうすればよいでしょうか? KuaishouはAI音楽創作モデルとAI歌手を独自に研究してきました。

音楽制作プロセスの観点から見ると、そのほとんどは合理化され、エンジニアリングされ、モジュール化される傾向があります。最初のステップは、創造的な動機を把握し、次に歌詞を書いて音楽を作曲し、次にアレンジし、最後に録音してミックスすることです。 Kuaishou が構築した AI モデルを通じて、各ステップを AI の助けを借りて完了することができます。

王中元氏は「AI時代には、モチベーションは非常にシンプルになりました。Kuaishou AI音楽モデルにランダムなキーワードを入力すると、モデルは単語をモチベーションの表現に変換し、さまざまな初期化された音楽に変換することができます。」と述べました。

[[404797]]

動機を決定した後、Kuaishou AI モジュールを使用して歌詞を生成できます。 AI歌詞に関しては、Kuaishouは数百万曲の既存曲でモデルを再トレーニングし、AIが言葉の意味をしっかりと理解できるようにし、ユーザーがテーマ、感情、スタイルを入力するだけで数秒で数十の歌詞を生成できるようにしました。

快手はAIメロディーの作成においても同様の手法を採用しており、数十万の楽譜と数百万の歌の音声でトレーニングモデルを構築し、ミニデータベースを使用してモデルが自己監督し、歌の本質的なつながりを学習できるようにすることで、AIメロディー生成能力をトレーニングしている。

快手はプラットフォーム上のミュージシャンを招待し、AIモデルを使って新曲を制作しているとみられる。制作されたポップミュージックには「Sweet Taste」「Night」「Go Forward」などがある。

高品質な完成した曲を録音するには、歌手に非常に高い歌唱力が必要です。歌声が音程外れだったり、音質が悪かったりといった一部のユーザーが抱える問題を解決するため、KuaishouはAI歌手支援作成機能を立ち上げ、モデルの精度を継続的に向上させてきた。

報道によると、2020年5月にはAI歌手のパフォーマンスはまだKTVレベルだったが、2020年12月には一般の人がAI歌手のパフォーマンスの欠点を見つけることは困難になった。現在では、モデルが楽譜に応じてピッチ、ビート、歌詞を自動的に調整し、AI歌手はプロの歌手の歌唱レベルを現実的に回復できるようになった。

王中元氏はスピーチの最後に、「今後、快手はゲームプレイの生成面を充実させるために、より多くの新技術を模索していきます。音声認識技術の助けを借りて、快手は将来、AI歌手が個人の音色を真似できるようになり、AI音楽が話し言葉を直接歌に変換できるようになり、ユーザーのよりパーソナライズされた音楽制作のニーズを満たし、短編動画の作成を継続的に支援できるようになることを期待しています」と述べた。

<<:  家賃決定問題を用いてK近傍法アルゴリズムを学ぶ

>>:  天才少年が自動運転の「自転車」を製作、ネットユーザー「テスラも見たら泣くだろう」

ブログ    

推薦する

人工知能とサイバーセキュリティは諸刃の剣

[[379153]] [51CTO.com クイック翻訳] 研究によると、人工知能技術はさまざまな業...

人工知能は世界を支配するのでしょうか?

技術が急速に進歩する時代において、人工知能 (AI) が最終的に世界を支配するかどうかという差し迫っ...

日常のセキュリティ運用におけるChatGPTの実装

導入人工知能(AI)の急速な発展により、AIは多くの業界、特に情報セキュリティの分野で重要なツールと...

スーパー暗号解読:自動運転はこうして実現される

[[336217]]多くの新製品と同様に、自動運転に対する人々の態度は、過度の信頼から過少な信頼まで...

...

...

ジェネレーティブAIの力を最大限に引き出す方法

生成 AI により、機械はコンテンツを作成し、人間の行動を模倣し、創造的な仕事に貢献できるようになり...

ペンシルバニア大学は、ディープニューラルネットワークの対称構造を研究し、層ごとの剥離解析モデルを提案した。

[[435206]]近年、ディープニューラルネットワークは多くの科学技術上の問題において優れたパフ...

インダストリー4.0におけるインテリジェントロボットの影響

インダストリー 4.0 でスマート ロボットを活用すると、企業は自動化、柔軟性、効率性、安全性の向上...

人工知能は 5 大製造業にどのような変化をもたらすのでしょうか? AIプロジェクトを成功に導く5つのステップ

今日、デジタル変革はビジネス存続の基盤となっています。自動化された工場から人工知能 (AI) 品質管...

暗号化アルゴリズムの鍵交換は少し安全ではない

今日は対称暗号化アルゴリズムの重要な問題についてお話ししましょう。暗号化の基本的な概念に精通していな...

外国メディアエクスプレス: 初心者が習得すべき機械学習のコアアルゴリズムトップ10

[51CTO.com オリジナル記事] Foreign Media Express は、ヌカ・コー...

Google AI、眼球スキャンから心臓病リスクを予測可能

グーグルと、同じくアルファベットグループの健康関連子会社であるベリリー・ライフ・サイエンシズが共同で...

ドローンが小型化するにつれて、その開発が成熟するためには3つの点を考慮する必要があります。

近年、コア技術の継続的な進歩と市場需要の継続的な解放により、ドローン産業は急速に発展しています。アプ...

10年後の市場規模は1.3兆ドル。「モデル電源時代」到来

半年以上にわたる大規模なモデル嵐の後、AIGC 市場には新たな変化が起こり始めました。クールな技術デ...