Amazon Transcribe は、開発者がアプリケーションに音声テキスト変換機能を簡単に追加できるようにする自動音声認識 (ASR) サービスです。 Amazon Transcribe API を使用すると、Amazon S3 に保存されている音声ファイルを分析し、サービスから文字起こしされた音声のテキストファイルを返すことができます。
Amazon Transcribe は、カスタマー サービス コールの文字起こしや、オーディオおよびビデオ コンテンツの字幕生成など、多くの一般的なアプリケーションに使用できます。このサービスでは、WAV や MP3 などの一般的な形式で保存された音声ファイルを書き起こし、各単語にタイムスタンプを添付して、テキストを検索することで元のソース内の音声を簡単に見つけることができます。 Amazon Transcribe は、言語の進化に合わせて継続的に学習し、改善しています。 主な特徴人間に優しい文字起こし ほとんどの音声認識システムの出力は、句読点のないテキストのストリームです。 Amazon Transcribe はディープラーニングを使用して句読点や書式設定を自動的に追加し、出力をよりわかりやすくして、さらに編集することなくすぐに使用できるようにします。 カスタム語彙 Amazon Transcribe を使用すると、音声認識語彙を拡張およびカスタマイズできます。基本語彙に新しい単語を追加して、製品名、ドメイン固有の用語、個人名など、ユースケースに固有の非常に正確な文字起こしを生成できます。 タイムスタンプを生成する Amazon Transcribe は各単語のタイムスタンプを返すため、テキストを検索することで元の録音内の音声を簡単に見つけることができます。 複数の話者を識別する Amazon Transcribe は話者の抑揚を認識し、それに応じてトランスクリプトを作成します。これにより、電話、会議、テレビ番組など、複数の話者がいる音声を書き起こすために必要な労力を大幅に削減できます。 幅広いユースケースをサポート Amazon Transcribe は、さまざまな品質のオーディオに対して正確な自動文字起こしを提供するように設計されています。あらゆるビデオ ファイルやオーディオ ファイルのキャプションを生成できるほか、カスタマー サービス通話などの低品質の電話録音を書き起こすこともできます。 チャンネル合成(近日公開予定) Amazon Transcribe は、音声をより適切に処理するために、各話者の音声を個別のチャネルで録音します。コンタクトセンターは、Amazon Transcribe に単一のオーディオファイルを送信すると、2 つのチャネルを識別して分離し、各チャネルの音声を書き起こし、チャネルラベルを使用して調整された統合された書き起こしを作成するというメリットを得られます。 ユースケースAmazon Transcribe は、カスタマーサービス、字幕作成、検索、コンプライアンスなど、幅広いユースケースに対応する文字起こしサービスを提供します。 顧客サービスの向上 Amazon Transcribe は、音声入力をテキストに変換することで、音声入力を検索および分析できるテキスト分析アプリケーションの構築に役立ちます。カスタマーコンタクトセンターは、Amazon Transcribe を使用して音声通話を書き起こし、Amazon Comprehend などの他の AWS 製品を使用してデータをマイニングし、会話から意味と意図を抽出することで洞察を得ることができます。 字幕ワークフロー Amazon Transcribe は、ビデオコンテンツと一緒に表示されるタイムスタンプ付きの字幕を自動的に生成することで、コンテンツ作成者やメディア発行者がリーチとアクセスを拡大するのに役立ちます。 オーディオアーカイブカテゴリー このサービスを使用すると、オーディオおよびビデオ資産を完全に検索可能なアーカイブに書き起こして、コンプライアンス監視とリスク管理に役立てることができます。お客様は、Amazon Transcribe を使用して音声をテキストに変換し、Amazon ElasticSearch Service を使用して音声/ビデオライブラリのインデックスを作成し、テキストベースの検索を実行できます。 |
教育部基礎教育司は1月11日、「教育部弁公庁による小中学校向け人工知能教育拠点の推薦に関する通知」(...
私たちは人工知能の存在に慣れ始めており、生成型人工知能(GenAI)の普及により、人工知能が世界に与...
翻訳者 |李睿レビュー | Chonglou近年、機械学習の応用が爆発的に増加しており、堅牢でスケー...
序文人工知能ブームは世界中を席巻し、数え切れないほどの人材が人工知能業界に集まっています。機械翻訳、...
2021年5月20日、北京中良プロトンネットワーク情報技術有限公司傘下の企業向けデジタルサービスプラ...
論文「DeepNet: Transformers を 1,000 層にスケーリング」が、Micros...
マルチエージェント システム (MAS) は、共通の目標または個別の目標を達成するために相互に対話お...
大規模言語モデル (LLM) は、適切なプロンプトがあれば、多くの自然言語処理タスクにとって強力なツ...
[[322859]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
誰もがこのような経験をしたことがあると思います。道路を運転しているとき、携帯電話は位置情報と速度を送...