AI インテリジェント音声認識アルゴリズム パート 2

AI インテリジェント音声認識アルゴリズム パート 2

[[397599]]

1. ニューラルネットワーク

現在一般的に使用されている音声認識フレームワークは以下のとおりです。

この背後にある論理は

特徴抽出に使用されるニューラルネットワークのDNN技術

DNN テクノロジーは、CNN モデルと RNN モデルの 2 種類に分けられます。

2. デコーダー

デコーダー情報は、音響モデル、辞書、言語モデルから取得されます。ブロック図は次のとおりです。

2.1 音響モデル

一般的に使用される音響モデルは、ガウスモデルと隠れマルコフモデルの混合モデルである GMM-HMM です。

HMM モデルは時系列情報をモデル化します。HMM の状態が与えられた後、GMM はその状態に属する音声特徴ベクトルの確率分布をモデル化します。

2.2 辞書

辞書:発音辞書です。中国語ではピンインと漢字の対応、英語では発音記号と単語の対応です。

使用:

音響モデルによって認識された音素に基づいて、辞書内で対応する漢字(単語)または単語が検索され、音響モデルと言語モデルの間に橋渡しが行われ、両者が接続されます。

たとえば、次の単語マッピング テーブル:

2.3 言語モデル

言語モデルは、特定の言語用に構築された確率モデルであり、文の確率を計算するために使用されます。

次の2つのタイプに分けます。

2.3.1 N-gram統計言語モデル: N-gramモデル、スムージング

2.3.2 ニューラルネットワーク言語モデル:

ニューラルネットワーク言語モデルは、統計言語モデルとは異なり、n 要素の条件付き確率をカウントによって推定するのではなく、ニューラルネットワークを通じて直接モデル化して解決します。

使用:

1. どちらの単語の並びがより可能性が高いかを判断する

2. いくつかの単語が与えられたら、次の単語を予測する

例:

1.私はパーティーに行きました。

目は2つのバーティーに行きました。

2. 今何をしていますか?

<<:  映画品質の CG レンダリングを作成しましょう!スタンフォード大学の研究者がニューラル光学レンダリングを提案

>>:  AI インテリジェント音声認識アルゴリズム パート 1

ブログ    
ブログ    

推薦する

AIの5つの本当の危険性

偽造品、アルゴリズムの偏り、その他の問題が私たちの日常生活に及ぼす影響過去数年間、人工知能は私たちの...

...

...

2020年にAIに適した5つのプログラミング言語

AI システムの開発にはコンピュータ コードが必要であり、コンピュータ プログラムを開発する際にはさ...

5歳の子供がAIを圧倒、「遊ぶ」だけで十分か?

この能力がアルゴリズムによって習得された後、AlphaGo は人間のチェスの名人を破り、OpenAI...

生成型AIが小学生の「初めてのプログラミングレッスン」に登場:線を描いて音楽を生成し、スケッチが一瞬で傑作に変わる

古典作品「星の王子さま」には、蛇が象を飲み込む絵を描いた少年が、大人たちにその絵を見せて怖いかと尋ね...

...

顔認識にはリスクがあり、米国は全面的に禁止しているが、なぜ中国はこれほど広く推進しているのだろうか?

顔認識にはリスクがあり、米国は全面的に禁止しているが、なぜ中国はこれほど広く推進しているのだろうか?...

バッチ正規化の呪い

バッチ正規化は、確かにディープラーニングの分野における大きな進歩の 1 つであり、近年研究者によって...

10x Nvidia GPU: Google TPUスタートアップチームによる、モデル固有の大型チップが一夜にして有名に

モデルが GPT-3.5 のように数千億の規模に達すると、トレーニングと推論のための計算能力は一般的...

論文の90%はモデル中心です。AIの分野では、データとモデルのどちらが重要ですか?

モデルとデータは AI システムの基盤であり、これら 2 つのコンポーネントはモデルの開発において重...

トランプ大統領は自動運転技術を承認せず、自動運転車は決して成功しないと述べている

最近、外国メディアは複数の情報筋の話として、トランプ大統領は自動運転技術を承認していないと報じた。ト...

74KBの写真も高解像度です。Googleはニューラルネットワークを使用して新しい画像圧縮アルゴリズムを作成しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

生成AI技術の原理を深く理解する: 生成AIの入門

人工知能を単純に目的別に分類すると、意思決定型AIと生成型AIの2つに分けられます。いわゆる意思決定...