テクノロジーの進歩により、人工知能 (AI) が徐々に出版業界に参入し始めており、特にオーディオブックの分野では、AI が生成した音声が朗読として機能し始めています。これにより、一部のプロの声優の間では、自分の声が AI にコピーされ、仕事の機会を失うのではないかと懸念する声が上がっています。 調査会社Wordsratedのデータによると、オーディオブック市場は2022年から2030年にかけて年間26%成長し、2030年までに350億米ドルに達すると予想されています(IT Home Note:現在約2,495.5億人民元)。業界が繁栄するにつれ、声優たちはAIがもたらす脅威に対してより警戒するようになっている。 CNBCによると、声優の中にはAIに音声モデルを提供することが求められる仕事を拒否している人もいるという。 実際、AI で生成された音声はすでに Google や Apple などのプラットフォームで使用されています。 Appleは、自社のBooksアプリで「ジャクソン」や「マディソン」という名前の声で朗読される数十冊のオーディオブックをひっそりとリリースした。 Google は出版社に自動読み上げ機能を提供しており、出版社がオーディオブックの著作権を所有している限り、この機能を使用することができます。 しかし、専門家は、AIが人間の話し方を完全に再現できるようになるまでには、まだ長い道のりがあると述べている。人間は話すときに独特のイントネーション、リズム、感情を示す。「人間は声にとても敏感です」と、吹き替え業界の幹部であるデビッド・チカレリ氏はCNBCに語った。「人間が最も得意とするのはタイミングです。ぎこちない間やユーモアのあるコメディー感覚など、AIの音声では一度にそれをするのは困難です。」 今年1月、海外メディアのInsiderはオーディオブックの抜粋5編をテストしたところ、どれが人間が読み上げたもので、どれがAppleのAI音声で生成されたものかを正しく判別することができた。しかし、メディアは、人間以外の声は完全に不快なものではないと報じた。 |
<<: AI トレーニングを容易にするために、分散を通じてクラウドで弾力的なスループットを実現するにはどうすればよいでしょうか?
グラフ ニューラル ネットワーク (GNN) は、機械学習でグラフ構造データを活用するための強力なツ...
[[407579]]序文大企業の秋季採用の先行スタートが始まっており、新卒採用の秋季大幅強化の警鐘が...
大規模言語モデル (LLM) 技術が成熟するにつれて、その適用範囲が拡大しています。インテリジェント...
[51CTO.com クイック翻訳] 人工知能 (AI) システムは経済を変え、大量の失業と巨大な独...
スーパーアプリは、より多くの顧客を引き付けるための革新的な戦略です。さらに、多数のサービスを 1 つ...
IDG Capital の投資家は、神経科学の専門家や最先端技術の起業家とともに、エネルギーと専門...
屈原・漁夫のアルゴリズムの追求を分析する前に、「漁夫」の原文を見てみましょう。屈原は流刑になった後、...
PaddlePaddleは今年8月、端末やエッジデバイス向けのエッジ推論エンジン「Paddle Li...
採用プロセスで人工知能テクノロジーに切り替えるのは難しいかもしれませんが、これらのヒントに従って、会...
進化するヘルスケアとテクノロジーの世界では、「感情 AI」と呼ばれる画期的なイノベーションが変化の兆...
2023 年には、人工知能 (AI) と Web3 という 2 つの技術現象が引き続き議論の中心にな...