IT Homeは4月12日、マイクロソフトが最近、最新の音声技術を発表したと報じた。この技術は「感情レベル」の簡単な調整をサポートし、インテリジェント音声の感情表現をより繊細かつ制御可能にする。
人間の感情は、声や口調の微妙な変化に大きく反映されます。たとえば、「さようなら」という言葉は、時には穏やかで控えめだったり、時には幸せでリラックスしていたり、時には決然として怒っていたりします。 Microsoft Intelligent Voice は、1 パーセントを定量単位、落ち着いた口調をゼロ点として使用して、明るい、悲しい、怒っている、怖い、不機嫌、真剣、愛情、優しさ、落ち込んでいる、恥ずかしい、穏やかなどの感情を定量化できます。これにより、仮想キャラクターは数千の感情を瞬時に持つことができ、コンテンツ作成がより現実的になります。 IT Homeは、小小、雲熙、雲葉、小漢、小軒、小墨、小瑞などマイクロソフトの人工知能中国語音声がすべて「感情レベル」調整技術をサポートしていることを知りました。彼らはそれぞれ年齢、性別、性格が異なります。 インテリジェント音声の感情レベル調整可能なデモビデオ: Microsoft Intelligent Speech Emotion Adjustment は適応型ニューラル ネットワークに基づいており、開発者は SSML タグ (音声合成マークアップ言語) を使用して感情の度合いを簡単に制御できます。同時に、プログラミングや SSML タグの経験がない一般ユーザーも、オーディオ コンテンツ作成プラットフォームを通じてこの機能を使用できます。
開発者向け: Microsoft インテリジェント音声感情調整テクノロジ感情調整例 1 一般向け:マイクロソフトのインテリジェント音声感情調整技術感情調整例2 さらに、自動テキスト感情分析技術と組み合わせることで、マイクロソフトのインテリジェント音声技術は感情のカテゴリーを自動的に予測し、感情の変化に満ちた作品をインテリジェントに解釈することができます。 Microsoft のインテリジェント音声感情調整テクノロジーにより、オーディオ制作はまるで監督のキャスティングのようになっており、最も適した音声と最も適切な感情を使用して、より良い作品を実現します。チャット ロボット、オーディオ ブックの読み上げ、映画やテレビの自動吹き替え、ゲームなどのシナリオに適しています。 AI オーディオ コンテンツ作成ツール: https://speech.microsoft.com/audiocontentcreation |
>>: AIがワンクリックでタトゥーを除去し、数秒でスターの「素顔」を見ることができる
Linux SNMP を十分に学習したい場合は、いくつかのモジュールに精通している必要があります。そ...
2020年5月、GPT-3はGPT-2のリリースから1年後に正式にリリースされました。GPT-2も...
ハイパーパラメータとは何ですか?学習モデルには、一般的に 2 種類のパラメータがあります。1 つはデ...
この記事では、線形回帰、ロジスティック回帰、線形判別分析、ナイーブベイズ、KNN、ランダムフォレスト...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
英国のメディア組織Tortoise Mediaは最近、2023年の世界AI指数ランキングを発表しまし...
さまざまな依存環境によって常に荒廃していますか?コンピューターと携帯電話の両方で実行できる、C++ ...
ウィリアム・ギブソンの2010年の小説『ゼロ・ヒストリー』では、ある登場人物が「これまでで最も醜いT...
周知のとおり、大学入試は我が国で最も競争率の高い試験です。世界最先端のロボットを大学入試に送り込んだ...
21 世紀の急速な都市化は、交通渋滞や汚染から住宅不足や公共サービスの逼迫まで、数多くの課題をもたら...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
[[411738]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
人工汎用知能 (AGI) とは、人間のような認知能力を備え、さまざまな領域にわたって理解、学習、タ...