オリンピックに乾杯! Baidu Smart Cloud と CCTV Sports Client が共同で新しいオリンピック放送体験を創造します。

オリンピックに乾杯! Baidu Smart Cloud と CCTV Sports Client が共同で新しいオリンピック放送体験を創造します。

[[416815]]

東京オリンピックが閉幕しました。中国選手団は金メダル38個、銀メダル32個、銅メダル18個を獲得し、海外オリンピックでの最高記録に並びました。オリンピック期間中、Baidu Brain の先進的な音声技術をベースにした Baidu Smart Cloud は、CCTV Sports Client を支援して、ユーザーにリアルな音声放送を提供し、オリンピックに新たな体験をもたらしました。

CCTV Sports Client はオリンピック競技ニュースの重要なプラットフォームとして、メダル情報を画像とテキストで表示するだけでなく、今回のオリンピック期間中に新たに追加されたインテリジェント音声放送モードもユーザーから好評を得ています。これは百度スマートクラウドの技術サポートと切り離せないものです。CCTVスポーツクライアントは百度スマートクラウドと提携し、高度に擬人化され、滑らかで自然な音声合成サービスを統合し、オリンピック競技のインテリジェント音声放送の新しいモードを生み出しました。優勝後は、インテリジェントなオーディオとテキストを推進し、タイムリーなオリンピック競技情報をユーザーに提供し、オリンピックの独特の魅力を感じさせます。


Baidu のインテリジェント クラウド音声合成サービスを使用すると、どこにいても最新のイベント アップデートを迅速かつ正確に取得でき、チャンピオンシップの瞬間を見逃すことはありません。

音声合成サービスが現実の放送体験をもたらす

オリンピック競技の情報伝達はタイムリーかつインテリジェントでなければなりません。ユーザーに高品質で多様なオリンピック体験を提供するためには、AI技術を有効活用することが重要です。

CCTV Sportsクライアントは、Baidu Brainが独自に開発した並列WaveRNN合成技術を採用したBaidu Intelligent Cloud音声合成サービスを統合しています。合成音声は高度に人間化されており、感情表現やリズム表現が大幅に向上しています。優勝が決まると、タイムリーに発表され、ユーザーは実際の放送のような体験を楽しむことができます。

主な技術的利点:非常に人間的で、滑らかで自然

WaveRNN 合成技術では、発音セグメントを基本合成単位として使用します。複数の発音セグメントが並列に合成され、各セグメントは自己回帰方式で順次合成されます。同時に、発音セグメント間の WaveRNN 隠し状態の連続性を確保するために、隠し状態予測ネットワークを使用して各発音セグメントの初期隠し状態を提供し、並列合成によって発生する WaveRNN 隠し状態の中断問題を効果的に解決し、並列合成の高品質を保証します。

一方、CPU と GPU の異種コンピューティングの使用、最適化された合成効率、ソフトウェアとハ​​ードウェアの協調的な加速により、元の WaveRNN のリアルタイム レートが低いという業界の問題を克服しました。この発音フラグメントに基づく隠れた連続 WaveRNN 並列リアルタイム音声合成技術は、従来のパラメータおよびスプライシング システムからニューラル TTS システムへの音声合成技術の変革を大きく促進し、Baidu が業界で初めて RNN ニューラル ボコーダーに基づく大規模な産業展開を完了することを可能にしました。

また、魅力的な男性の声、甘い女性の声、かわいい子供の声など、さまざまなスタイルの音声ライブラリを提供しており、中国語や中国語と英語の混合読み上げも問題ありません。同時に、顧客が高品質の合成音声をカスタマイズできるように、Baidu Smart Cloud は、実際の人の発音効果に近く、高い復元性、高い明瞭性、高い安定性などの利点を備えたカスタマイズされた音声ソリューションもサポートしています。Baidu Smart Cloud は、顧客のビジネスニーズに迅速に対応し、顧客向けの音声をカスタマイズできます。

マルチシナリオアプリケーション、高品質な体験がすぐそばに

オリンピック競技の放送以外にも、Baidu Intelligent Cloud 音声合成技術には多くの応用シナリオがあり、あなたのすぐそばにあります。

  • 本の読み聞かせ:音声合成技術を採用した読書アプリは、さまざまなサウンドライブラリからの読み上げ機能をユーザーに提供し、ユーザーの手と目を解放して、より高度な読書体験を提供します。たとえば、iReader や Qimao Novels などのよく使われる製品はすべて、Baidu Smart Cloud の音声合成技術を採用しています。
  • ニュース放送:ニュースや情報放送のシナリオ向けに特別に設計された特別なサウンド ライブラリを提供し、携帯電話、スピーカー、その他のデバイスをプロのアンカーにして、いつでもどこでもユーザーに新鮮な情報を放送し、ユーザーに多様なニュース体験をもたらします。
  • 注文アナウンス:タクシーに乗るとき、レストランで電話番号を呼ぶとき、待ち行列ソフトウェアを使用するときなどに、注文アナウンスを聞くことができます。 Baidu Smart Cloud は Didi Chuxing などのクライアントと協力して注文ブロードキャスト アプリケーションを作成し、ユーザーが通知情報を簡単に取得できるようにしました。
  • スマートハードウェア:音声合成技術を子供向け読み聞かせ機、スマートロボット、タブレット端末などのスマートハードウェアデバイスに統合することで、ユーザーとデバイス間のインタラクションがより自然でフレンドリーになります。たとえば、Baidu Smart Cloud はこの技術を Aimouse や Ruobo Technology などのスマートハードウェアに適用し、ユーザーに強力なインタラクションをもたらしています。

今後、百度スマートクラウドは、スポーツイベントの数を増やし、エキサイティングな競争ゲームを提供するために、AIテクノロジーの利点を十分に発揮し、インテリジェントで革新的なサービスを継続的に生み出し、さまざまなシーンで顧客のニーズを満たし、ユーザーがまるでスタジアムにいるかのような感覚を味わえるようにし、AIテクノロジーがもたらす新しいスポーツイベント体験を真に体験できるようにします。

<<:  ハイパーオートメーションの旅を始めましょう: 仕事のやり方を変え、運用プロセスを簡素化しましょう

>>:  自動化とロボット工学:どちらがあなたの会社に適していますか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

量子コンピューティングがサプライチェーン管理を改善する方法

サプライチェーン業務における量子コンピューティングのユースケースでは、意思決定モデル内の複雑で不可能...

AI時代における我が国の人工知能開発の長所と短所の分析

人工知能が人々の生活にますます大きな影響を与えるにつれて、人工知能技術は絶えず更新され、反復され、ま...

携帯電話が1秒で3Dホログラムを生成する、MITチームの新しい研究

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

RPAにより業務効率が大幅に向上、40%の企業が効果を確認

効率性、俊敏性、生産性に対する需要が高まるにつれ、新しいテクノロジーとアプリケーションが、企業と企業...

マルチエージェントシステムにおける協力:MASにおける不確実性、社会的メカニズム、強化学習の探究

マルチエージェント システム (MAS) は、共通の目標または個別の目標を達成するために相互に対話お...

LLaMA-v2-Chat と Alpaca: 異なる AI モデルはいつ使用すべきですか?

翻訳者 |李睿レビュー | Chonglou今日、大規模言語モデル (LLM) は、言語生成から画像...

プログラマーは30歳で転職すべきでしょうか?曲がるならどちらの方向がいいでしょうか?

最近、皆さんは次のような H5 に悩まされていると思います。広告ポスター500枚の予算は2,000元...

ドジャースが勝利! AIが野球ワールドシリーズの意思決定プロセスを支配

ドジャースのファンは、チームが再びワールドシリーズで優勝するのを見るために32年間待ち続けた。野球は...

自律走行レースのためのマルチモーダルセンサーフュージョンとターゲット追跡

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

インテルは世界的なIT需要爆発の機会を無駄にしない

危機に対処する最善の方法は常に変化を求めることです。 国連は5月18日、最新の世界経済情勢予測を発表...

パニックになってるんですか?ロボットは共感の兆しを発達させ始めており、ロボットパートナーの次の動きを予測することができます。

[[375354]] 2 匹の霊長類が長期間一緒に飼育されると、同居人、同僚、家族の即時の行動をす...

2021年の世界人工知能産業の市場規模と投資・資金調達状況を分析人工知能は今後スパイラル状に発展する

人工知能業界の主要上場企業:現在、国内の人工知能業界の上場企業は主に百度(BAIDU)、テンセント(...

LLM の成功に欠かせない基礎: RLHF とその代替技術

LLM について議論するときは、必ず「人間のフィードバックによる強化学習 (RLHF)」と呼ばれるプ...

ADMap: 干渉防止オンライン高精度マップへの新しいアプローチ

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

Python が Java や C/C++ に勝って機械学習に最適な言語である理由!

Python は、1989 年にオランダ人の Guido van Rossum によって発明され、...