マイクロソフトの人工知能音声技術は「複数の感情レベル」の調整をサポートし、「人間の声」の繊細な解釈を可能にする

IT Homeは4月12日、マイクロソフトが最近、最新の音声技術を発表したと報じた。この技術は「感情レベル」の簡単な調整をサポートし、インテリジェント音声の感情表現をより繊細かつ制御可能にする。

[[392706]]

人間の感情は、声や口調の微妙な変化に大きく反映されます。たとえば、「さようなら」という言葉は、時には穏やかで控えめだったり、時には幸せでリラックスしていたり、時には決然として怒っていたりします。 Microsoft Intelligent Voice は、1 パーセントを定量単位、落ち着いた口調をゼロ点として使用して、明るい、悲しい、怒っている、怖い、不機嫌、真剣、愛情、優しさ、落ち込んでいる、恥ずかしい、穏やかなどの感情を定量化できます。これにより、仮想キャラクターは数千の感情を瞬時に持つことができ、コンテンツ作成がより現実的になります。 IT Homeは、小小、雲熙、雲葉、小漢、小軒、小墨、小瑞などマイクロソフトの人工知能中国語音声がすべて「感情レベル」調整技術をサポートしていることを知りました。彼らはそれぞれ年齢、性別、性格が異なります。

インテリジェント音声の感情レベル調整可能なデモビデオ:

Microsoft Intelligent Speech Emotion Adjustment は適応型ニューラルネットワークに基づいており、開発者は SSML タグ (音声合成マークアップ言語) を使用して感情の度合いを簡単に制御できます。同時に、プログラミングや SSML タグの経験がない一般ユーザーも、オーディオコンテンツ作成プラットフォームを通じてこの機能を使用できます。

 <speak version= "1.0" xmlns= "http://www.w3.org/2001/10/synthesis" xmlns:mstts= "https://www.w3.org/2001/mstts" xml:lang= "zh-CN" > >voice name = "zh-CN-XiaoxiaoNeural" > 急いで行きましょう。道路上の安全には十分注意してください。早く行って早く帰ってきてください。

開発者向け: Microsoft インテリジェント音声感情調整テクノロジ感情調整例 1

一般向け：マイクロソフトのインテリジェント音声感情調整技術感情調整例2

さらに、自動テキスト感情分析技術と組み合わせることで、マイクロソフトのインテリジェント音声技術は感情のカテゴリーを自動的に予測し、感情の変化に満ちた作品をインテリジェントに解釈することができます。

Microsoft のインテリジェント音声感情調整テクノロジーにより、オーディオ制作はまるで監督のキャスティングのようになっており、最も適した音声と最も適切な感情を使用して、より良い作品を実現します。チャットロボット、オーディオブックの読み上げ、映画やテレビの自動吹き替え、ゲームなどのシナリオに適しています。

AI オーディオコンテンツ作成ツール: https://speech.microsoft.com/audiocontentcreation

<<: 鉄道欠陥検出における機械学習の実用化

>>: AIがワンクリックでタトゥーを除去し、数秒でスターの「素顔」を見ることができる

ブログ

中国人がさらに7,360万ドルの資金調達を実施した！天才プログラマーが共同設立したLeCunの重鎮たちが全員サポート

マイクロソフトの人工知能音声技術は「複数の感情レベル」の調整をサポートし、「人間の声」の繊細な解釈を可能にする

中国人がさらに7,360万ドルの資金調達を実施した！天才プログラマーが共同設立したLeCunの重鎮たちが全員サポート

AIはDevOpsエクスペリエンスに目に見える以上の変化をもたらす

TCP輻輳制御アルゴリズムについての簡単な説明

CMU と Adobe が協力: GAN モデルは事前トレーニングの時代を先導し、トレーニングサンプルのわずか 1% しか必要としません

OpenAI は GPT-4 をすべての有料 API ユーザーに公開します

基準に問題があり、人工知能は間違った方向に向かっている

AI 異常検出は企業にどのようなメリットをもたらすのでしょうか?

Midjourney はテキストを生成できます。 V6バージョンの5つの主要なアップグレードがネットユーザーを驚かせる

MuskxAIの創設メンバーが中国で最初の声明を発表: ChatGPTの時代では「困難な時代に英雄が現れる」、次のステップはより多くの数理科学データトレーニングを使用することです

推薦する

AIがDotAのトッププレイヤーに勝利したのは画期的なことでしょうか？ OpenAIが詳細を発表

私の国のロボット産業には隠れた懸念があります。すべての関係者が協力して高品質の開発を推進します

人工知能がチップのルネッサンスを推進

RPA がコロナウイルス危機を乗り越えるために組織をどのように支援しているか

見ないと後悔するよ！ 2019年の人工知能業界の25の主要トレンド

最新の Claude 200K は本当に「誤ったラベル」が貼られているのでしょうか?神は1016ドルを費やしてテストしましたが、90Kを超えるとパフォーマンスが急激に低下しました。

OpenAI: GPT-5が危険すぎる場合、理事会はアルトマンの釈放を阻止する権利がある

認知知能は魔法のようなもの：2021 年の主要なブレークスルーを振り返る

ファーウェイがAI戦略とフルスタックの全シナリオAIソリューションを発表

機械学習における3つの重要なデータ課題

OpenAI が GPT をロボットの脳に組み込み、具現化された AGI のシンギュラリティが近づいています。エヌビディアとマイクロソフトがユニコーン企業フィギュアキャピタルに26億ドルを投資

百度が新製品「小度」を発売、マルチラウンド対話と子供向けモードを追加

セキュリティ | 機械学習の「データ汚染」を 1 つの記事で理解する

ジャック・マー：機械が人間に取って代わることは決してできない！それは何に代わるのでしょうか?