Amazon Pollyについて

Amazon Pollyについて

Amazon Polly は、テキストをリアルな音声に変換するサービスです。これにより、音声を発するアプリケーションを作成したり、まったく新しい音声対応製品を構築したりすることができます。 Amazon Polly は、高度なディープラーニング技術を使用して人間のような音声を合成するテキスト読み上げサービスです。

Amazon Polly は、多数の言語で数十種類のリアルな音声を提供しているため、最適な音声を選択して、さまざまな国で動作する音声対応アプリケーションを構築できます。

利点

自然な音

Amazon Polly は、数十の言語と、ネイティブの男性と女性のさまざまな音声で利用できます。 Amazon Polly はテキストを流暢に読み取ることができるため、世界中のユーザーに高品質の音声出力を提供できます。

音声の保存と再生

Amazon Polly を使用すると、生成された音声を追加料金なしで初めて再生できます。 MP3 や OGG などの標準形式で音声ファイルを作成し、アプリ内やデバイス上、クラウド サービス内、またはローカルに保存してオフラインで再生することができます。

リアルタイム応答

リアルなサウンドと会話型のユーザー エクスペリエンスを実現するには、一貫して高速な応答時間が不可欠です。 Amazon Polly の API にテキストを送信すると、音声をストリームとしてアプリケーションに返すこともできるので、すぐに音声を再生できます。

音声出力をカスタマイズおよび制御する

ニーズに合わせて Amazon Polly の音声を変更する – Amazon Polly は辞書と SSML タグをサポートしており、発音、音量、ピッチ、発話速度などの音声の側面を制御できます。

低コスト

Amazon Polly の従量課金制、文字あたりの変換コストの低さ、初回再生により、コスト効率の高い音声合成をアプリケーションに実装できます。

<<:  Amazon Rekognition の紹介

>>:  Amazon Lexについて

ブログ    
ブログ    

推薦する

1 つの記事で機械学習を理解する: 基本概念、5 つの主要な流派、9 つの一般的なアルゴリズム

1. 機械学習の概要 1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば...

あなたの「読書」は他の人に読まれている。清華大学の研究者はWeChatの「Look」からこれらのパターンを発見した。

WeChatの「Take a Look」アプリの最もアクティブなユーザーは実は私たちの両親であり、...

最高速度:250fps!リアルタイムの高性能車線検出アルゴリズムLaneATT

CVPR 2021 車線検出論文: 車線から目を離さない: リアルタイムの注意誘導型車線検出。紙:...

GoogleのAutoML人工知能システムは、人間よりも優れた機械学習コードを作成できるようになりました

Google の AutoML システムは最近、研究者自身よりもさらに効率的な一連の機械学習コードを...

Facebook が ICCV 2021 で 2 つの 3D モデルを公開。自己監督が究極の答えか?

長い間、CV トレーニングは 2 次元データに限定されてきました。3 次元データのラベル付けにはコス...

...

AIが中古高級品の真贋を判別、同社は精度は99.1%と主張

12月26日、高級品鑑定機関Entrupyは人工知能技術を使用して、さまざまなブランドのハンドバッグ...

...

2020年に会話型AIはどのように発展するでしょうか?

会話型 AI は今日のイノベーションに不可欠な要素であり、多くの企業のビジネスを変革するでしょう。 ...

AI検出器は復活するのか?成功率は98%と高く、OpenAIを上回っている。

現在の AI テキスト検出器には、AI が生成したテキストと人間が作成したテキストを効果的に区別する...

自動運転車はすでに登場していますが、船舶が AI に取って代わられるまでには長い時間がかかるのでしょうか?

次回フェリーに乗るときは、ブリッジをよく見ることを忘れないでください。舵を取っているのは人間ではない...

Baidu Brain CVサービスでは、100~1000元のクーポンを提供しています。

覚えていますか? 「小都」はかつて「The Brain」の舞台でエネルギー溢れる出場者たちと競い合い...

2022年の銀行業界における人工知能の応用

人工知能はあらゆる分野に革命をもたらしており、銀行業も例外ではありません。 調査によると、世界の人工...