AIの威力を改めて見せつける! Baidu Map 20分間のカスタマイズされたパーソナル音声パッケージ

AIの威力を改めて見せつける! Baidu Map 20分間のカスタマイズされたパーソナル音声パッケージ

百度地図は9月19日、「あなたのための『音声』、そして『AI』」記者会見で「音声カスタマイズ機能」を正式に発表した。社内コード名は「百曲玲」。これは地図音声カスタマイズ製品です。ユーザーは百度地図アプリで20文を録音するだけで、約20分で完全な個人用音声パッケージを生成でき、来たる国慶節の旅行に新鮮な体験をもたらします。

「百度地図のエンジニアたちは、社内でこれを『百雀霊』と呼んでいます。百雀とは、美しく心地よいさまざまな鳴き声を持つ自然界のさまざまな鳥の総称です。『百雀霊』とは、何千人ものユーザーが百度地図上で自分の音声パッケージを録音し、自分だけのユニークな声で愛する人への思いやりや友情を表現できることを意味します。」百度地図事業部のゼネラルマネージャー、李穎氏は次のように述べた。「音声カスタマイズ機能は、百度地図を強化したAIのもう一つの傑作です。今回の音声技術と百度地図の統合により、科学技術の力が解き放たれ、技術進歩がもたらす変化と感動を誰もが感じることができることを願っています。」

専用音声パッケージをカスタマイズするプロセスは非常に簡単です。Baidu Map アプリを開き、「Xiaodu Xiaodu」を起動して「私の音声を録音して」と言うか、Baidu Map ホームページで「旅行アシスタント」をクリックして「音声カスタマイズ」に入るだけで、音声カスタマイズの旅を始めることができます。静かな環境で、百度地図の指示に従って、漫画や映画やテレビのセリフなど、録音された興味深いテキストを読み上げ、約20分待つだけで、自分だけの音声パックを手に入れることができ、百度地図の景勝地スマート音声ガイド、スマート音声インタラクション、ナビゲーションなど、あらゆるシーンで使用できます。誰でも自分や家族の音声パックを無料で使用して、景勝地を巡り、放送を聞くことができます。また、録音した個人音声パッケージは、親戚や友人と共有することもできます。子供を恋しく思う親でも、遠く離れた恋人でも、地図音声パッケージを通じて愛する人に近づくことができます。ユーザーの「人気」音声パックは、Baidu Maps によって公式に推奨され、マップの「良い音声」になる機会もあります。

(「シャオドゥシャオドゥ」と叫んで音声パッケージの録音を開始します)

これまで、マップ音声パックの制作には、専門のレコーディングスタジオで大量の言語素材を録音する必要があり、制作には数か月かかっていました。プロセスは複雑で時間がかかるため、マップ音声パックは「有名人限定」となっていました。今、Baidu Mapsの音声カスタマイズ機能により、誰もが「大スター」になれるのです。

音声カスタマイズ機能のリリースに伴い、百度地図の「銀河プロジェクト」が正式に開始されました。第1段階では、華晨宇や秦嵐などの人気アーティストが招待され、個人音声パッケージの録音に参加して百度地図の「スターナビゲーター」となり、すべてのユーザーの旅を新鮮に満たしました。 「ギャラクシープロジェクト」の立ち上げは、有名人の音声パックを録音するための敷居が大幅に下がり、誰もが星のように広大で人々に多くの想像力を与える有名人品質の音声パックを録音できることを意味します。

Baidu Map の音声カスタマイズ機能の背後には、Baidu Brain の音声テクノロジーの強化があります。 AI技術のサポートにより、マップ音声パッケージの制作は月単位から分単位への飛躍的進歩を遂げ、音声パッケージの制作モデルも再定義されました。

百度音声のチーフアーキテクトである賈磊氏は記者会見で、その背後にある技術について次のように明らかにした。「百度地図の音声カスタマイズ機能は、百度の話者韻律転送技術Meitronに基づいています。その特徴は主に、話者音色変換、多感情読み上げ、韻律スタイル転送の3つの側面に反映されており、パーソナライズされた音声合成のカスタマイズの閾値を大幅に下げています。百度の音声技術は、AI時代にさらなる可能性を秘めていると信じています。」

多くの親はかわいい赤ちゃんの音声パックを録音したいと思っていますが、赤ちゃんの発音が不明瞭だったり、間が不規則だったり、中国語が標準的でなかったりすることを心配せずにはいられません。Baidu Mapの音声カスタマイズ機能はこれらの問題を克服し、子供の声の合成を実現しました。同日、百度地図とベビーバスは「幸せな啓蒙と安全な出発」の取り組みを開始し、「千千妙妙」音声パックを発売した。このタイプの漫画音声パックは、運転中に親が赤ちゃんの感情を落ち着かせ、旅行の安全を確保するのに役立ちます。

ユーザーが非常に懸念している音声データのセキュリティ問題について、百度地図は、音声カスタマイズサービスへの百度地図のアクセスは音声パッケージの録音にのみ使用され、他の目的には使用されないと述べた。 Baidu Maps は、ユーザーの許可と同意なしに、ユーザーの音声パッケージを他のユーザーと共有することはありません。

AI 技術の強力なサポートにより、新世代の人工知能マップである Baidu Maps は革新とリードを続けています。今後も百度地図は進化を続け、より安全でスマート、そして効率的な旅行サービスをユーザーに提供していきます。この建国記念日の休日には、独自のボイスパックと AI マップをご持参ください。

<<:  北京、上海、深セン、杭州、中国の人工知能産業のリーダーは誰でしょうか?

>>:  ロボットが人間に取って代わるのは時間の問題です。まずこれらの仕事がなくなるでしょう。

ブログ    
ブログ    
ブログ    

推薦する

...

Sinovationは、あらゆるもののインテリジェントな接続を促進するエッジインテリジェンスプラットフォームTurboXを立ち上げました。

[51CTO.comより引用] 2019年を振り返ると、今年は人工知能、モノのインターネット、クラ...

PyTorch と TensorFlow で画像分類モデルをトレーニングする方法

導入画像分類は、コンピューター ビジョンの最も重要なアプリケーションの 1 つです。その応用範囲は、...

悪いデータは良いAIを殺すことが判明

[[421984]]データ サイエンティストは、データの準備があらゆる AI システムの成功に非常に...

エッジAIはIoTのメリットを高める

今日のデジタル世界では、人工知能とモノのインターネットが私たちの生活のあらゆる側面に大きな変化をもた...

Python データマイニングと機械学習入門

データマイニングとは何ですか?機械学習とは何ですか?Python データの前処理を実行するにはどうす...

AIの将来はどうなるのでしょうか?

人間のような知能を実現するという永遠の夢を超えて、AI の将来は消費者市場と商業市場の両方で極めて重...

2018年のソフトウェア開発に関する10の予測、注目のブロックチェーンとAIを含む

[[221321]]ブロックチェーン、NLP、AI 駆動型ツール、機械学習、サーバーレス コンピュー...

...

自撮り写真でAIがあなたの顔を認識できないようにする方法

現在、顔認識システムがプライベートな写真で訓練されるのを防ぐツールがますます増えている。個人の写真を...

...

9つの思考フレームワーク:ChatGPTの使用能力を100倍向上させる

1. APEモデル「アクション、目的、期待」(APE) モデルは、アクション、目標、期待を明確にする...

...