マイクロソフトの人工知能音声技術は「複数の感情レベル」の調整をサポートし、「人間の声」の繊細な解釈を可能にする

マイクロソフトの人工知能音声技術は「複数の感情レベル」の調整をサポートし、「人間の声」の繊細な解釈を可能にする

IT Homeは4月12日、マイクロソフトが最近、最新の音声技術を発表したと報じた。この技術は「感情レベル」の簡単な調整をサポートし、インテリジェント音声の感情表現をより繊細かつ制御可能にする。

[[392706]]

人間の感情は、声や口調の微妙な変化に大きく反映されます。たとえば、「さようなら」という言葉は、時には穏やかで控えめだったり、時には幸せでリラックスしていたり​​、時には決然として怒っていたりします。 Microsoft Intelligent Voice は、1 パーセントを定量単位、落ち着いた口調をゼロ点として使用して、明るい、悲しい、怒っている、怖い、不機嫌、真剣、愛情、優しさ、落ち込んでいる、恥ずかしい、穏やかなどの感情を定量化できます。これにより、仮想キャラクターは数千の感情を瞬時に持つことができ、コンテンツ作成がより現実的になります。 IT Homeは、小小、雲熙、雲葉、小漢、小軒、小墨、小瑞などマイクロソフトの人工知能中国語音声がすべて「感情レベル」調整技術をサポートしていることを知りました。彼らはそれぞれ年齢、性別、性格が異なります。

インテリジェント音声の感情レベル調整可能なデモビデオ:

Microsoft Intelligent Speech Emotion Adjustment は適応型ニューラル ネットワークに基づいており、開発者は SSML タグ (音声合成マークアップ言語) を使用して感情の度合いを簡単に制御できます。同時に、プログラミングや SSML タグの経験がない一般ユーザーも、オーディオ コンテンツ作成プラットフォームを通じてこの機能を使用できます。

  1. <speak version= "1.0" xmlns= "http://www.w3.org/2001/10/synthesis" xmlns:mstts= "https://www.w3.org/2001/mstts" xml:lang= "zh-CN" > >voice name = "zh-CN-XiaoxiaoNeural" > 急いで行きましょう。道路上の安全には十分注意してください。早く行って早く帰ってきてください。

開発者向け: Microsoft インテリジェント音声感情調整テクノロジ感情調整例 1

一般向け:マイクロソフトのインテリジェント音声感情調整技術感情調整例2

さらに、自動テキスト感情分析技術と組み合わせることで、マイクロソフトのインテリジェント音声技術は感情のカテゴリーを自動的に予測し、感情の変化に満ちた作品をインテリジェントに解釈することができます。

Microsoft のインテリジェント音声感情調整テクノロジーにより、オーディオ制作はまるで監督のキャスティングのようになっており、最も適した音声と最も適切な感情を使用して、より良い作品を実現します。チャット ロボット、オーディオ ブックの読み上げ、映画やテレビの自動吹き替え、ゲームなどのシナリオに適しています。

AI オーディオ コンテンツ作成ツール: https://speech.microsoft.com/audiocontentcreation

<<:  鉄道欠陥検出における機械学習の実用化

>>:  AIがワンクリックでタトゥーを除去し、数秒でスターの「素顔」を見ることができる

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ケンブリッジ大学チームは約50年後に初めて量子スピン液体を検出し、その研究はサイエンス誌に掲載された。

[[439547]]一部の研究者は、量子コンピューターがいつの日かデジタル暗号の解読や薬剤の設計な...

需要は拡大し続けており、配達ロボットには克服すべきいくつかの大きな技術的課題がある

特別なイベントの影響を受けて、非接触型の配達や食事が需要のトレンドになっています。その結果、業界にお...

プロジェクト Digging 21 - 軽量 LLM エージェントの構築方法

8 月 12 日、Juli プロジェクト シリーズの第 21 回「大規模言語モデルのトレーニングとア...

2022 年の 5 つの主要な AI と機械学習のトレンド

[[414740]]人工知能と機械学習の分野では、企業が今から準備しておくべき大きなトレンドがいくつ...

純粋な乾物 | ディープラーニング研究の概要

[[195952]] 1. ディープラーニングディープラーニングといえば、一度でも触れたことがある人...

...

配達員に代わるドローン配達は、人々に「嫌われるのではなく愛される」ようになる

現在、人々の生活や仕事のペースはますます加速し、インターネット電子商取引プラットフォームは急速に発展...

人工知能の台頭が懸念を引き起こしています。私たちはどう対応すべきでしょうか?

AlphaGoがイ・セドルに勝利したことで世界は人工知能に再び親しむようになったが、アップグレード...

人間の姿勢評価技術の開発と実装

[51CTO.com クイック翻訳]関連調査レポートによると、デジタルフィットネス市場の規模は202...

AIチャットボットが保険業界に革命を起こす

[[398082]]時代遅れのレガシープロセスを考慮すると、保険事業とテクノロジーの融合は水と油のよ...

大型模型のレイアウトは何度も変わります!

ChatGPT の Android バージョンが登場します。 OpenAI は今年 5 月に早くも...

デジタルヒューマンのための大規模モデル

ビッグモデルはソフトウェア業界全体を変えるでしょう。その代表的な製品の一つがデジタルヒューマンです。...

...

Belcorp CIO: AI による IT 研究開発の見直し

多国籍美容企業ベルコープは過去3年間、パンデミック、消費者行動の変化、サプライチェーンの混乱、インフ...