音声分析:自動運転車の鍵となる技術

音声分析:自動運転車の鍵となる技術

サプライチェーン管理、製造業務、モビリティサービス、画像およびビデオ分析、音声分析の進歩により、次世代の自律走行車は自動車消費者の認識を変えると期待されています。これらの技術が発展し続けると、自動運転車業界の世界市場規模は2030年までに600億ドル近くに達すると予想されています。

[[434781]]

自動運転車向け機械学習による音声分析には、音声分類、NLP、音声/音声、サウンド認識が含まれます。特に音声認識は自動運転車技術の不可欠な部分となり、ドライバーに強化された制御を提供します。これまで、音声認識は、効率的なアルゴリズム、信頼性の高い接続性、エッジ処理能力の欠如により、従来の自動車モデルでは課題となっていました。さらに、車内の騒音により音声分析のパフォーマンスが低下し、誤認識につながる可能性があります。

機械による音声分析は継続的な研究の対象となっています。テクノロジーが進歩するにつれ、Amazon の Alexa や Apple の Siri などの新製品が登場しています。これらのシステムは、クラウド コンピューティング テクノロジーを通じて急速に進化しており、これは他の認識システムにこれまで欠けていた戦略です。

最近では、kNN (最近傍法)、SVM (サポートベクターマシン)、EBT (アンサンブルバッグドツリー)、ディープニューラルネットワーク (DNN)、自然言語処理 (NLP) などのさまざまな機械学習アルゴリズムにより、音声分析がより効果的になり、自動運転車に付加価値を与えるための位置づけが向上しました。

オーディオ分析では、データが前処理されてノイズが除去され、その後オーディオ データからオーディオ機能が抽出されます。ここでは、MFCC (メル周波数ケプストラム係数) などのオーディオ機能と、尖度や分散などの統計機能が使用されます。 MFCC の周波数帯域はメルスケール上で等間隔に配置されており、これは人間の聴覚システムの反応に非常に近いものです。最後に、トレーニングされたモデルは、車内に設置された複数のマイクからリアルタイムのオーディオ ストリームを取得し、前処理して特徴を抽出することで推論に使用されます。抽出された特徴は、音声を正しく認識するためにトレーニング済みのモデルに渡され、自動運転車で正しい判断を下すのに役立ちます。

データ処理と機械学習モデルのトレーニング

新しいテクノロジーでは、エンドユーザーの信頼が重要であり、NLP は自動運転車に対する信頼を構築する上で大きな変化をもたらします。 NLP により、乗客はレストランでの停車のリクエスト、ルートの変更、最寄りのショッピングモールでの停車、ライトのオン/オフ、ドアの開閉など、音声コマンドを使用して車を制御できます。これにより、乗客の体験は豊かでインタラクティブなものになります。

オーディオ分析が自動運転車に役立つアプリケーションをいくつか見てみましょう。

緊急サイレン検知

救急車、消防車、パトカーなどの緊急車両のサイレンは、さまざまなディープラーニング モデルや SVM (サポート ベクター マシン) などの機械学習モデルを使用して検出できます。教師あり学習モデル - SVM は分類と回帰分析に使用されます。 SVM 分類モデルは、緊急サイレン音と非緊急音の大量のデータを使用してトレーニングされました。このモデルでは、警報音を認識し、自動運転車が危険な状況を回避するために適切な判断を下すシステムが開発されています。この検出システムを導入すれば、自動運転車は緊急車両が通過できるように路肩に寄ることを決定できるだろう。

異常エンジン音検知

エンジン故障の可能性を自動かつ早期に検出することは、自動運転車にとって不可欠な機能となる可能性がある。車のエンジンは、正常に作動しているときは特定の音を出し、何か問題が発生すると別の音を出します。 K-means クラスタリングで利用可能な多くの機械学習アルゴリズムを使用して、エンジン音の異常を検出できます。 k-means クラスタリングでは、サウンドの各データ ポイントが k 個のクラスター グループの 1 つに割り当てられます。データ ポイントは、そのクラスターの重心の周りの平均値に基づいて割り当てられます。異常なエンジン音の場合、データ ポイントは正常クラスターの外側に落ち、異常クラスターの一部になります。このモデルを使用すると、エンジンの状態を継続的に監視できます。異常な音響イベントが発生した場合、自動運転車はユーザーに警告し、危険な状況を回避するための適切な判断を下すのに役立ちます。これにより、エンジンの完全な故障を防ぐことができます。

車線変更にはクラクションを鳴らす

自動運転車が人間が運転する車と完全に同じように機能するためには、後続車が緊急追い越しの際に車線変更を要求し、クラクションを鳴らしてその旨を知らせる必要がある状況で、自動運転車が効果的に機能する必要があります。ランダム フォレストは、このタイプの分類問題に最適な機械学習アルゴリズムです。これは教師あり分類アルゴリズムです。名前が示すように、決定木のフォレストを作成し、最終的にすべての決定木をマージして正確な分類を行います。このモデルは、特定のホーンパターンを認識し、それに応じて決定を下すシステムを開発するために使用できます。

NLP (自然言語処理) は人間の言語を処理して意味を抽出し、意思決定に役立ちます。乗員は単に指示を与えるだけでなく、実際に自動運転車に話しかけることもできる。自動運転車にアドリアナのような名前を割り当てたとします。すると、車に「アドリアナ、お気に入りのコーヒーショップに連れて行って」と指示することができます。これはまだ理解しやすい簡単な文ですが、「お気に入りのコーヒーショップに連れて行って、そこに着く前にジムの家に立ち寄って彼を迎えに来て」など、より複雑な文を自動運転車に理解させることもできます。危険な状況、たとえば生命を脅かす状況などを回避するために、自動運転車は所有者の指示に盲目的に従うべきではないことに注意することが重要です。危険な状況で効果的な判断を下す、

したがって、機械学習ベースのオーディオ分析は、安全性と信頼性の向上により自動運転車の人気の高まりに起因しています。機械学習が進歩するにつれて、音声分析、NLP、音声認識などのサービスを提供し、乗客の体験、道路の安全性、自動車エンジンのタイムリーなメンテナンスを向上させる、サービスベースの製品がますます増えています。

<<:  今後 20 年間で AI はすべての業界にどれほどの影響を与えるでしょうか?営業担当者も入れ替わるのでしょうか?

>>:  Python で自然言語処理を始める

ブログ    
ブログ    

推薦する

...

AIを活用して史上最も変動の激しい資産クラスを制御する

私たちは現在、歴史上最も激動の経済、技術、社会の時代を生きています。年初から拡大し始めた新型コロナウ...

...

ダブル11プロモーション?貪欲アルゴリズムを使用して解決してください。

[[351760]]この記事はWeChatの公開アカウント「Java Chinese Commun...

...

...

エッジにおける AI について知っておくべきことすべて

近年、人工知能の応用は世界中で大きな進歩を遂げています。職場でのビジネス活動の拡大に伴い、クラウド ...

MIT の驚くべき証明: 大きな言語モデルは「世界モデル」ですか?アンドリュー・ン氏の視点が再び確認され、LLMは空間と時間を理解できる

大きな言語モデルの中には世界モデルがあるのでしょうか? LLM には空間感覚がありますか?そして、こ...

AmapとDAMO Academyが共同で車載ARナビゲーションを導入し、従来の運転体験を覆す

Amapは本日、車載ARナビゲーションを共同で立ち上げるためにDAMOアカデミーと協力関係を結んだと...

マイクロソフトのグローバル副社長ハリー・シャム氏:AIは社会変革を極限まで推し進める

[[248704]] 11月6日午前のニュース、第20回「21世紀のコンピューティング」学術セミナー...

...

史上最大のAI著作権訴訟を徹底分析! OpenAI は失敗する運命にあるのでしょうか、それともニューヨーク・タイムズが勝つ可能性はゼロなのでしょうか?

ニューヨーク・タイムズによるOpenAIとマイクロソフトに対する訴訟は、AI技術の発展に影響を及ぼす...

Googleは、生成AI製品のユーザーを著作権侵害の申し立てから保護することを約束

Googleは10月13日、現地時間公開のブログ投稿で、自社の生成AI製品のユーザーは当局によって保...

Python、Java、C++がすべて含まれています。このGitHubプロジェクトは、複数の言語で古典的なアルゴリズムを実装しています。

古典的なデータ構造とアルゴリズムをいくつ知っていますか?大企業で面接を受けてみませんか?アルゴリズム...

人工知能は優れたサイバーセキュリティツールだが、諸刃の剣でもある

[[245793]]セキュリティにおける AI の役割は、ホワイトハットハッカーとサイバー犯罪者の両...