マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能

マイクロソフトがテキスト読み上げアバター AI ツールを発表: Azure プラットフォームをベースに仮想 3D デジタル人物を作成可能

IT Homeは11月16日、MicrosoftがIgniteカンファレンスでAzure AI Speech用の「Azure AI Speech テキスト読み上げ(TTS)アバター」というAIツールを発表したと報じた。人間のリアルな仮想アバター(デジタルヒューマン)を生成できるとしている。このツールは現在、プレビュー版として一般公開されている。

マイクロソフトは、ユーザーはAzure AI Speechのテキスト読み上げ(TTS)アバターを使用して、「テキストを入力して内容を話す」ことに基づいて仮想アバターを作成し、それを実際の写真トレーニングと組み合わせて、実際の人々に基づいた「インタラクティブなチャットボット」を作成できると述べた。これは、企業のマーケティング、ビジネス、または顧客サービスのシナリオで使用できる。

この Azure AI Speech テキスト読み上げ (TTS) アバターは、主にテキスト アナライザー、TTS サウンド シンセサイザー、TTS 仮想アバター シンセサイザーの 3 つのモジュールで構成されていると報告されています。

テキスト アナライザーは、まずユーザーが入力したテキストを分析し、音素シーケンスを生成します。 TTS サウンド シンセサイザーの TTS 音声モデルは、ユーザーが入力したテキストの音響特性を予測し、サウンドを合成します。最後に、ニューラルネットワーク音声合成モデルアバターが、上記の音響特徴に基づいてキャラクターの唇の形状画像を予測し、最終的に仮想アバター画像を形成します。

マイクロソフトは、従来のバーチャルアバターの制作には時間と労力がかかり、専用の撮影環境の整備が必要で、撮影後の編集作業にもかなりのコストがかかると説明した。現在、マイクロソフトの最新の Azure AI Speech テキスト読み上げ (TTS) アバター サービスを使用することで、初期モデルが確立された後は、ユーザーはテキストを入力するだけで、さまざまな製品紹介やインタラクティブ ビデオなどを作成できます。 Microsoft Azure OpenAI サービスとニューラル ネットワーク TTS 機能を組み合わせることで、より自然なインタラクティブ エクスペリエンスを提供することもできます。

IT Home は、Microsoft が、ユーザーは Azure AI Speech TTS アバターを使用して、企業文化ビデオ、製品紹介、カンファレンスでの CEO のデジタル アバターなど、さまざまなビデオ コンテンツを一括作成できると主張していることを発見しました。また、仮想ライブデジタルヒューマン、チャットロボット、ビジネスロボット、オンライン教育用の AI 教師などを作成することもできます。

Microsoft は、Azure AI Speech のテキスト読み上げ (TTS) アバターが Azure サブスクライバー向けに提供され、さまざまな言語をサポートしていると述べました。ユーザーは、プリセットのアバター オプションから希望のキャラクターを選択したり、独自のアバターをカスタマイズしたりできます。

ユーザーが独自の仮想アバターをカスタマイズしたい場合は、キャラクターのビデオ クリップを一括アップロードする必要があります。Azure プラットフォームはこれらのビデオをオンラインで処理して仮想アバターを生成します。キャラクター本体と音源は分離されており、ユーザーは公式が提供するデフォルトの音源を選択したり、独自のトレーニング音源をアップロードしたりすることができます。

<<:  NVIDIA が TensorRT-LLM の新バージョンをプレビュー: 推論能力が 5 倍に向上、8GB 以上のグラフィック カードがローカルで実行可能、OpenAI の Chat API をサポート

>>:  ロビン・リー:AIネイティブ時代の「冷たい」思考と「熱い」ドライブ

ブログ    
ブログ    

推薦する

研究者は人工知能を使って、膨大なデータに隠された異常をリアルタイムで発見する

全国的な送電網の障害を特定することは、巨大な干し草の山から針を見つけるようなものです。米国全土に設置...

数学的パラドックスが人工知能の限界を証明する

人間は一般的に何かが間違っていることを認識するのが得意ですが、AI システムはそうではありません。新...

...

復旦大学の論文は、3体のSFシーンを実現:体にディスプレイ画面を装着し、ナビゲートやチャットも可能

誰もが歩くディスプレイ画面であり、これは単なる SF のワンシーンではありません。羅吉が最も感動した...

TensorFlow を使い始めるための重要なポイントをここにまとめました。まだ怠ける理由がありますか?

この記事の著者である Steven Dufresne は、初心者が TensorFlow を学習する...

テンセントのロボットファミリーに新しいメンバーが加わりました。「新年の挨拶をして紅包をお願いする」ことができるロボット犬を見たことがありますか?

テンセントは3月2日、自社で完全に開発したソフトウェアとハ​​ードウェアを搭載した初のマルチモーダル...

...

全国人民代表大会代表劉清鋒氏:2019年は人工知能の大規模応用の年となる

[[258931]]今日の科学技術分野における最も最先端のトピックとして、人工知能は3年連続で政府活...

AI時代における我が国の人工知能開発の長所と短所の分析

人工知能が人々の生活にますます大きな影響を与えるにつれて、人工知能技術は絶えず更新され、反復され、ま...

デジタルマーケティングにおけるAI革命

ほんの数年前までは、マーケティングに特化した AI エンジンがマーケティングの未来につながると信じて...

...

...

鉄道欠陥検出における機械学習の実用化

【51CTO.com クイック翻訳】はじめに列車が走行しているとき、線路には大きな圧力がかかることが...

財務報告分析:マイクロソフトの生成AIへの賭けは成功したが、グーグルは依然として苦戦中

マイクロソフトとグーグルが財務報告を発表したが、一方は喜び、他方は悲しんだ。 AIへの大胆な賭けのお...