マイクロソフトが3月4日に公式発表したところによると、Azure Cognitive Servicesの音声サービスの一部であるCustom Neural Voiceのテキスト読み上げ機能がこのほど一般提供開始されたという。この機能により、ユーザーは Microsoft の画期的なニューラル テキスト読み上げモデルを使用して、アプリ用に非常にリアルで人間のようなカスタム音声を作成できるようになります。作成された音声は非常にリアルであるため、Microsoft はユーザーが責任を持ってテクノロジを使用できるようにアクセスを制限しています。 マイクロソフトは、
カスタム音声を作成するには、音声を録音し、それをトレーニング データとしてアップロードするだけです。 Azure Speech Services は、録音に合わせて独自の音声チューニングを作成します。カスタム ニューラル音声はリアルで自然な音声で、ブランドを表現し、ユーザーが自然な会話形式でアプリと関わることを可能にします。 Microsoft は、以下の顧客がすでにこの最新の TTS 機能を使用していることを強調しています。
|
<<: 将来、ロボットは手術を支援し、反復作業をより効率的に実行できるようになるかもしれない。
>>: 2つのセッションにおけるインターネット大手の提案の要約:デジタル経済とスマートカーが頻出語に
[[257117]] [51CTO.com クイック翻訳] 今日では、携帯電話の写真ストリーム認識...
[[406748]]従来のニューラル ネットワーク レイヤーは完全に接続されています。サンプリング...
ここ数日、古くからあるAIアプリケーション「AI変顔」が何度も話題となり、ホットな検索ワードに何度も...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
翻訳者 |ブガッティレビュー | Chonglouコードレビューは、現代のソフトウェア開発において重...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
機械学習と人工知能:違いは何ですか?機械学習は人工知能のサブフィールドですが、すべての人工知能技術が...
[[417184]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
「シナプストランジスタ」は、脳の可塑性を模倣して、データの処理と保存を同時に行うことができます。 ...
ハッカーが制御を強めるために生成 AI モデルに偽の情報を挿入するなど、データ汚染の増加により AI...
IBM CEO の Arvind Krishna 氏は CRN とのインタビューで、今年 IBM ...
シュメール王国の時代から、この賢明な王国の人々はデータを記録し、国勢調査を実施し、食糧を配給し始めま...