音声分析:自動運転車の鍵となる技術

音声分析:自動運転車の鍵となる技術

サプライチェーン管理、製造業務、モビリティサービス、画像およびビデオ分析、音声分析の進歩により、次世代の自律走行車は自動車消費者の認識を変えると期待されています。これらの技術が発展し続けると、自動運転車業界の世界市場規模は2030年までに600億ドル近くに達すると予想されています。

[[434781]]

自動運転車向け機械学習による音声分析には、音声分類、NLP、音声/音声、サウンド認識が含まれます。特に音声認識は自動運転車技術の不可欠な部分となり、ドライバーに強化された制御を提供します。これまで、音声認識は、効率的なアルゴリズム、信頼性の高い接続性、エッジ処理能力の欠如により、従来の自動車モデルでは課題となっていました。さらに、車内の騒音により音声分析のパフォーマンスが低下し、誤認識につながる可能性があります。

機械による音声分析は継続的な研究の対象となっています。テクノロジーが進歩するにつれ、Amazon の Alexa や Apple の Siri などの新製品が登場しています。これらのシステムは、クラウド コンピューティング テクノロジーを通じて急速に進化しており、これは他の認識システムにこれまで欠けていた戦略です。

最近では、kNN (最近傍法)、SVM (サポートベクターマシン)、EBT (アンサンブルバッグドツリー)、ディープニューラルネットワーク (DNN)、自然言語処理 (NLP) などのさまざまな機械学習アルゴリズムにより、音声分析がより効果的になり、自動運転車に付加価値を与えるための位置づけが向上しました。

オーディオ分析では、データが前処理されてノイズが除去され、その後オーディオ データからオーディオ機能が抽出されます。ここでは、MFCC (メル周波数ケプストラム係数) などのオーディオ機能と、尖度や分散などの統計機能が使用されます。 MFCC の周波数帯域はメルスケール上で等間隔に配置されており、これは人間の聴覚システムの反応に非常に近いものです。最後に、トレーニングされたモデルは、車内に設置された複数のマイクからリアルタイムのオーディオ ストリームを取得し、前処理して特徴を抽出することで推論に使用されます。抽出された特徴は、音声を正しく認識するためにトレーニング済みのモデルに渡され、自動運転車で正しい判断を下すのに役立ちます。

データ処理と機械学習モデルのトレーニング

新しいテクノロジーでは、エンドユーザーの信頼が重要であり、NLP は自動運転車に対する信頼を構築する上で大きな変化をもたらします。 NLP により、乗客はレストランでの停車のリクエスト、ルートの変更、最寄りのショッピングモールでの停車、ライトのオン/オフ、ドアの開閉など、音声コマンドを使用して車を制御できます。これにより、乗客の体験は豊かでインタラクティブなものになります。

オーディオ分析が自動運転車に役立つアプリケーションをいくつか見てみましょう。

緊急サイレン検知

救急車、消防車、パトカーなどの緊急車両のサイレンは、さまざまなディープラーニング モデルや SVM (サポート ベクター マシン) などの機械学習モデルを使用して検出できます。教師あり学習モデル - SVM は分類と回帰分析に使用されます。 SVM 分類モデルは、緊急サイレン音と非緊急音の大量のデータを使用してトレーニングされました。このモデルでは、警報音を認識し、自動運転車が危険な状況を回避するために適切な判断を下すシステムが開発されています。この検出システムを導入すれば、自動運転車は緊急車両が通過できるように路肩に寄ることを決定できるだろう。

異常エンジン音検知

エンジン故障の可能性を自動かつ早期に検出することは、自動運転車にとって不可欠な機能となる可能性がある。車のエンジンは、正常に作動しているときは特定の音を出し、何か問題が発生すると別の音を出します。 K-means クラスタリングで利用可能な多くの機械学習アルゴリズムを使用して、エンジン音の異常を検出できます。 k-means クラスタリングでは、サウンドの各データ ポイントが k 個のクラスター グループの 1 つに割り当てられます。データ ポイントは、そのクラスターの重心の周りの平均値に基づいて割り当てられます。異常なエンジン音の場合、データ ポイントは正常クラスターの外側に落ち、異常クラスターの一部になります。このモデルを使用すると、エンジンの状態を継続的に監視できます。異常な音響イベントが発生した場合、自動運転車はユーザーに警告し、危険な状況を回避するための適切な判断を下すのに役立ちます。これにより、エンジンの完全な故障を防ぐことができます。

車線変更にはクラクションを鳴らす

自動運転車が人間が運転する車と完全に同じように機能するためには、後続車が緊急追い越しの際に車線変更を要求し、クラクションを鳴らしてその旨を知らせる必要がある状況で、自動運転車が効果的に機能する必要があります。ランダム フォレストは、このタイプの分類問題に最適な機械学習アルゴリズムです。これは教師あり分類アルゴリズムです。名前が示すように、決定木のフォレストを作成し、最終的にすべての決定木をマージして正確な分類を行います。このモデルは、特定のホーンパターンを認識し、それに応じて決定を下すシステムを開発するために使用できます。

NLP (自然言語処理) は人間の言語を処理して意味を抽出し、意思決定に役立ちます。乗員は単に指示を与えるだけでなく、実際に自動運転車に話しかけることもできる。自動運転車にアドリアナのような名前を割り当てたとします。すると、車に「アドリアナ、お気に入りのコーヒーショップに連れて行って」と指示することができます。これはまだ理解しやすい簡単な文ですが、「お気に入りのコーヒーショップに連れて行って、そこに着く前にジムの家に立ち寄って彼を迎えに来て」など、より複雑な文を自動運転車に理解させることもできます。危険な状況、たとえば生命を脅かす状況などを回避するために、自動運転車は所有者の指示に盲目的に従うべきではないことに注意することが重要です。危険な状況で効果的な判断を下す、

したがって、機械学習ベースのオーディオ分析は、安全性と信頼性の向上により自動運転車の人気の高まりに起因しています。機械学習が進歩するにつれて、音声分析、NLP、音声認識などのサービスを提供し、乗客の体験、道路の安全性、自動車エンジンのタイムリーなメンテナンスを向上させる、サービスベースの製品がますます増えています。

<<:  今後 20 年間で AI はすべての業界にどれほどの影響を与えるでしょうか?営業担当者も入れ替わるのでしょうか?

>>:  Python で自然言語処理を始める

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

AIが古代のテキストを解読し、ネイチャーの表紙に登場:失われたテキストを修復し、地理的な場所と執筆時間を正確に特定

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習のバックボーン: モデル構築のためのインフラストラクチャ ツールは何ですか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

.Net Framework ガベージ コレクション固有のアルゴリズムの詳細な説明

.Net Framework は、Microsoft が提供する .NET 開発に基づいた基本環境で...

...

現代のサイバーセキュリティに人工知能が必要な理由

ダイヤルアップ インターネットの時代よりずっと以前、ウイルスが感染したフロッピー ディスクを介して拡...

人工知能は教育の新たな発展を促進し、これら3つの分野に大きな影響を与えます。

今年の流行語について聞かれたら、「人工知能」という言葉は誰もが知っていると思います。人工知能は多くの...

【ディープラーニング】敵対的生成ネットワーク(GAN)を徹底解説!

1. 概要敵対的生成ネットワーク (GAN) は、コンピューターを通じてデータを生成するために使用...

Alibaba のエンジニアは、ナレッジ グラフ データ構築の「難題」にどのように取り組んでいるのでしょうか?

[[233069]]アリ姉の紹介:「トマト」を検索すると、その栄養価やカロリーがわかるだけでなく、...

ロボットは意識を獲得できるのか?もしそうなら、どうやって知るのでしょうか?

一部の専門家は、人間は簡単に知能ロボットを作成し、それが知能を持っていることを知ることができると考え...

2020年のAIの7つの開発トレンド

[[320187]]追加の AI アプリケーションの需要が高まるにつれて、企業はデータ サイエンス ...

学術界の巨人たちのブラックテクノロジー:人工知能のダークマターについて聞いたことがありますか?

北京大学の公式サイトの最新情報によると、元UCLA(カリフォルニア大学ロサンゼルス校)教授の朱松春...