人工知能はますます私たちに近づいている

人工知能はますます私たちに近づいている

科学者たちは、歌詞付きの歌を聞くと読書の妨げになりやすいのと同じように、音声信号とテキスト信号が脳に入るときにいくつかの処理経路を共有することに長い間気づいていました。関連する探検は、100年以上前にある若者の偶然の発見にまで遡ることができます。

[[419130]]

1874年、カール・ウェルニッケは有名な神経病理学者セオドア・マイナートのもとで学んでいました。彼は2人の奇妙な患者を記録した。彼らは何らかの言語障害を抱えているようでしたが、症状は典型的な表現性失語症とはまったく異なっていました。彼らは流暢に話したり書いたりすることができましたが、言葉はすべて意味不明でした。ウェルニッケは最終的に、現在では感覚失語症と呼ばれているこの症状が、側頭葉の後部と上部の脳損傷に起因すると結論付けた。患者の言語理解能力が破壊されるため、患者は自分が言ったことや書いたことを忘れてしまうことがよくあります。「何を言おうとしていたのだろう?」現代の科学者は、脳の活動を観察する過程で、ついに脳内に音声とテキストの「収束領域」が存在することを確認しました。これらの領域は、音声とテキストの両方の理解を担っています。

外国語の映画を見るとき、字幕を見ればスムーズに映画を見ることができます。ここでの字幕は音声翻訳技術を利用しており、ソース言語の音声をターゲット言語(母国語など)のテキストに翻訳します。

しかし、コンピューターにとって、音声とテキストは非常に異なる方法で表現されます。テキストは通常​​、数十個の記号で構成されているだけですが、音声は数百万個にも及ぶ連続した音の波形で構成されています。同じ言葉を発しても、誰が、どのような環境で、どのような状況で発するかによって、まったく違って聞こえることがあります。さらに、音声とテキストは異なる方法でエンコードされます。テキストの単語は語根と接辞で構成されています。スピーチは一連の形態素で構成され、強調とイントネーションによって補完されます。

人間にとって簡単なことでも、人工知能にとっては非常に難しい場合があります。テキストと音声の違いは非常に大きいため、テキスト処理の研究は実りある成果を上げている一方で、音声のパフォーマンスは大きく遅れをとっています。このギャップを埋めるには、私たちの脳と同じように、音声とテキストを均一に理解する必要があります。

現在、人工知能を研究する際には、解剖学や神経学からインスピレーションを得てモデルを最適化するようになり、人工知能はますます私たちに近づいてきています。

<<:  デジタルツインの成功事例4つ

>>:  人工知能の時代では、女の子よりも男の子の方が失業する可能性が高いです!

ブログ    

推薦する

柯潔はなぜ「負けてカッとなった」と言ったのか!人間対機械の第一ラウンドを説明する8つの質問

4時間以上の対局の末、柯潔はAlphaGoに0.25ポイント差で負けた。対局後、アルファ碁の指導に参...

Dry goods: アルゴリズムの学習に役立つオープンソース プロジェクト

[[321744]]今日、LeetCode の問題やさまざまなアルゴリズム ルーチンを分析できる優れ...

...

救世主か、それとも公敵か? 人工知能の現在と未来を説明する記事

囲碁チャンピオンのイ・セドルを破ったロボット「アルファ碁」から、卓球ができるKUKAロボット、遠隔手...

...

マイクロソフト、機械学習モデル向けの高性能推論エンジン ONNX をオープンソース化

Microsoft は、Linux、Windows、Mac プラットフォーム向けの ONNX 形式の...

チップレベルのエッジAIが次世代のIoTを推進

エッジ コンピューティングは、IT アーキテクトや組み込み開発者にさまざまな選択肢を提示する難しい問...

...

データ構造とアルゴリズム、グラフをトラバースする2つの方法を理解する

[[331362]] 1 はじめにトラバーサルとは、特定のノードから開始し、特定の検索ルートに従って...

ハイエンドチップはインテリジェント運転の問題を解決できるでしょうか?

この数か月の「影響」を経て、誰もが半導体不足の事実を十分に認識したと思います。2020年12月以来、...

仕事再開時に間接接触を避けるには?顔認識アクセス制御で徹底した予防と管理を実現

職場復帰の日が近づくにつれ、全国で生産や業務が徐々に再開されているが、同時に防疫活動も緩めてはならな...

多言語自然言語処理 (NLP) で言語の壁を打ち破ります!

自然言語処理は言語の壁を打ち破り、人間と機械間の相互作用とコミュニケーションを強化します。自然言語処...

Appleのアプリランキングアルゴリズム調整の裏側:ランキング管理企業が一夜にして沈黙

4月1日早朝のニュース:3月初旬から、AppleはAppランキングアルゴリズムを徐々に調整し、ランキ...

文字列マッチングのためのボイヤー・ムーアアルゴリズム

前回の記事では、KMPアルゴリズムを紹介しました。ただし、これは最も効率的なアルゴリズムではなく、実...

知っておくべき 8 つのニューラル ネットワーク アーキテクチャ

ニューラル ネットワークは機械学習におけるモデルの一種です。ニューラル ネットワークは、機械学習の分...