AI はあらゆる人間の声を再現できます。これはポッドキャストにとって何を意味するのでしょうか?

AI はあらゆる人間の声を再現できます。これはポッドキャストにとって何を意味するのでしょうか?

ポッドキャスティングは、よりカジュアルな形式のオーディオストーリーテリングへと進化しています。複雑な言語は存在せず、ホストとリスナーの関係性に重点が置かれています。ホストは、すべてを理解しやすく、反応しやすくするために言語を使用しようとします。オーディオストーリーの人気は高まっており、データもそれを裏付けています。 Statistaによると、2018年には米国にすでに7,500万人のポッドキャストリスナーがおり、2024年までに月間リスナー数は1億6,400万人に達すると予想されています。 2019年から2023年までのCAGRは17%と推定されています。

[[345947]]

2020年には、アメリカ人の4分の3がポッドキャストを認識しており、半数以上(55%)がすでにポッドキャストを聴いていると主張しています。世界で最も収益の高いポッドキャストは、ジョー・ローガンの「The Joe Rogan Experience」で、2019年に5,000万ドルを稼ぎ、毎月2億回近くダウンロードされています。 現在ポッドキャスト業界が直面している主な問題は、編集の独立性を維持しながら、このような急速な成長を支えるために必要なリソースをどのように集めるかであり、音声複製機能を備えた人工知能などの画期的な技術が、少なくとも部分的な解決策を提供できる可能性があります。 ニクソン プロジェクトは、AI が人間の声を元の声と区別がつかないほどに再現できるという説得力のある例です。

MITの研究者、ジャーナリスト、アーティストのチームが、音声クローン会社RespeecherおよびVDR会社Canny AIと共同で、宇宙飛行士のニール・アームストロングとエドウィン・「バズ」・オルドリンがミッションを完了できずに月面に取り残された最初の月面探検のもう一つの歴史を作成した。 彼らはニクソン大統領の実際のビデオを改変して偽物を作成し、月面着陸は悲劇的な結末を迎えたと彼が世界に語るのを聞かせた。

ポッドキャストにおける人工知能の活用方法

コンピューター音声の主な課題は、ロボットのような音声を避けながら、人間の声や感情のニュアンスを再現することです。人工知能技術を活用した音声変換技術は、この目標を正確に達成する手段を提供します。

[[345948]]

Apple の Siri、Amazon の Alexa、Microsoft の Cortana、Google Assistant などの仮想アシスタントは、依然としてテキスト読み上げ機能を使用しています。 TTS は今でも非常に便利なテクノロジーですが、音声を異なる音にするのは非常に複雑です。 たとえば、Siri を年配の男性のように話すには、事前に録音されたファイルに加えて、会話のすべての単語を含む新しいオーディオ ファイルが必要になります。音声から音声への変換がもたらすメリットをいくつか見てみましょう。 AI を使用してポッドキャスターの音声クローンを作成するにはどうすればよいでしょうか? AI によって音声クローンが可能になります。あらゆるポッドキャスト プロジェクトのあらゆるサウンドを完璧に再現するのに役立ちます。 「スマートカクテル」は通常、古典的なデジタル信号処理アルゴリズムと独自のディープ生成モデリング技術の 2 つの要素で構成されており、コンテンツ制作者は最も適切なサウンドを使用できます。

有名人をプロジェクトに招待する

俳優、作家、アスリートなどが有名になればなるほど、彼らをポッドキャストに出演させることは難しくなります。しかし、人工知能を使って人間の声を再現すれば、非常に忙しい人間がスタジオに到着するのを待つ必要はありません。聴衆をレコーディングスタジオに連れて行くために多くの時間と費用をかけなくても、聴衆にお気に入りのサウンドの録音を提供することができます。

昔の音を取り戻す

たとえ俳優が亡くなっていたとしても、音声クローンはプロジェクトを希望通りに完成させるのに大いに役立ちます。亡くなる前のケネディ大統領に関する歴史的なポッドキャストを制作していますか? 音声変換テクノロジーを使用すると、近似声ではなく、大統領の正確な声を使用できます。

子どもの声を活用する

子どもたちは、必ずしも内容が面白いのではなく、単に言い方(口調、イントネーション、アクセントなど)が面白いという理由で、よくとても面白いことを言います。同時に、彼らと一緒に働くことは困難です。音声合成では、プロの俳優が子供とまったく同じように言葉を話すことで、このプロセスを簡素化できます。

[[345949]]

画像ソース: unsplash

· ポッドキャストプロジェクトが完了するまでスピードアップ

人工知能は人間の声を一瞬で再現することができます。必要なのは、対象となるサウンドの高品質な録音を提供することだけであり、それほど時間はかかりません。 2017年、ポッドキャストの広告収入は2億2000万ドルに達し、毎年倍増しています。潜在的な広告主を引き付ける主な要因は、ユーザーエンゲージメントの向上と、ポッドキャスト広告が約 90% の完了率で視聴可能であるという事実です。 さらに、広告主は特定のポッドキャスト スロットに対して最大 30 ドルの CPM (インプレッション 1,000 回あたりのコスト) を支払う用意があります。 Facebook の平均 CPM が 6 ドルであることを考慮すると、この数字はより納得がいきます。 ケーブルテレビは徐々にネットワークテレビに取って代わっており、ポッドキャストとラジオには多くの類似点があります。この類推をラジオ広告予算に限定したとしても、ポッドキャスト業界の現在の財政状況にさらに 200 億ドルの利益がもたらされることになります。冒頭で述べたように、リスナー数の増加は、利益の継続的な体系的な成長への期待を正当化します。

[[345950]]

画像ソース: unsplash

このような数字は、ポッドキャスティングが今後も定着し、オーディオ コンテンツの作成者を支援するより効果的な方法が切実に必要であることを明確に示しています。上に挙げた点は、AI が実現できることのほんの一部にすぎません。AI による音声クローン ポッドキャストは、業界全体を発展させ、編集の独立性の問題をより適切に処理することができます。

この記事はWeChatの公開アカウント「Reading the Core」から転載したもので、以下のQRコードからフォローできます。この記事を転載する場合は、Duxinshu の公開アカウントにご連絡ください。

<<:  5Gのサポートにより、AIの顔を変えること以外に人工知能は何ができるのでしょうか?

>>:  マイクロソフトとパートナーは、AIへのアクセスを制限するデータ砂漠の縮小に取り組んでいる。

ブログ    
ブログ    
ブログ    

推薦する

...

AI技術年次報告:中国の2つの側面におけるパフォーマンスは注目に値する

スタンフォード大学は最近、「人工知能指数(2018年グローバルAIレポート)」を発表しました。これは...

オープンソースのコラボレーションを通じて AI を進化させる方法

[[377773]]人工知能は、業界団体によって大々的に宣伝され、推進されている用語の 1 つになっ...

...

Bengio が参加、LeCun が気に入る: グラフ ニューラル ネットワークの権威あるベンチマークがオープンソースに

[[317692]]グラフニューラルネットワークはどの程度発展しましたか?現在、評価専用のベンチマー...

エッジコンピューティングと人工知能について知っておくべき7つのこと

エッジ コンピューティングと AI はどのように連携するのでしょうか? エッジ コンピューティングが...

...

AIと自動化はCOVID-19後のビジネス成功の鍵

COVID-19 パンデミックが発生する前は、ビジネスリーダーたちは、ビジネス運営の最適化、収益性の...

OpenAI の COO が ChatGPT のリリース、開発者デー、そして Altman の考えについて語る

「アルトマン氏をご存知なら、彼は話題を素早く切り替えるのが好きなので、私たちが一つの話題に多くの時間...

調査結果:人工知能はクリエイターにより多くのファンと収入をもたらす可能性がある

7月18日、DescriptとIpsosがポッドキャストや動画の制作者1,004人を対象に実施した調...

信じられますか?これら 8 つの AI テクノロジーにより、すでに次のことが可能になっています...

人工知能(AI)は私たちが想像していたものではありません。未来だけに存在する概念で、世界を変えること...

AIに「子犬」を認識させますか? Facebookは変化を感知できるAIを構築

[[389144]]今まで見たことのない犬種や色であっても、私たちは一目見てその犬を認識することがで...

人工知能の主要技術:強化学習(RL)

人工知能技術はますます急速に進歩しており、それぞれのサブテクノロジーが生み出す価値もますます顕著にな...

...