アンサンブル法からニューラルネットワークまで:自動運転技術で使用される機械学習アルゴリズムとは?

アンサンブル法からニューラルネットワークまで:自動運転技術で使用される機械学習アルゴリズムとは?

現在、機械学習アルゴリズムは、自動運転車業界で増加している問題を解決するために大規模に使用されています。 ECU(電子制御ユニット)センサーデータと組み合わせて、機械学習手法の使用を強化し、新たな課題に対応する必要があります。潜在的な用途としては、LIDAR、レーダー、カメラ、モノのインターネット (IoT) など、車両の内外に分散されたセンサーを使用して、さまざまなデータを融合し、運転者の状態を評価したり、運転シナリオを分類したりすることが挙げられます。

車両補助システムを実行する関連プログラムは、データ融合センサーシステムから関連情報を受信して​​判断することができます。たとえば、システムがドライバーの体調が悪いことに気付いた場合、車を病院に再ルーティングすることができます。この技術は機械学習に基づいており、運転手の声や動きを認識し、言語翻訳も行うことができます。アルゴリズムは一般的に、教師あり学習と教師なし学習の 2 つのカテゴリに分けられます。両者の違いは学習方法の違いにあります。

教師あり学習は、与えられたトレーニング セットから学習することによって行われ、モデルが事前に設定された期待値に達するまで (つまり、エラー率が最小化されるまで) 学習プロセスが継続されます。教師あり学習アルゴリズムは、回帰、分類、異常検出、次元削減アルゴリズムなど、いくつかのカテゴリに分類できます。

教師なし学習は、利用可能なデータセットから内部構造とパターンを学習しようとします。つまり、アルゴリズムは、提供されたデータに基づいて関係性を推測し、パターンを検出したり、個々のデータ間の類似性に基づいてデータセット内のデータを自動的に分類したりすることを目指します。教師なしアルゴリズムの大部分は、さらに相関ルール学習やクラスタリングアルゴリズムなどに分類できます。

強化学習アルゴリズムは、教師なし学習と教師あり学習の中間に位置する別のタイプの機械学習アルゴリズムです。各トレーニング サンプルに対して、教師あり学習には対応するカテゴリ ラベルがありますが、教師なし学習にはそれがありません。強化学習では、報酬メカニズムの一部として時間遅延とスパース ラベルを使用します。環境で学習される動作は、報酬メカニズムの設定によって異なります。強化学習の目的は、アルゴリズムの長所と短所を理解し、それを改善することです。このアルゴリズムは、人工知能から工学制御、オペレーションリサーチに至るまで、自律走行車の開発に関連する実用的応用から生じる幅広い問題の解決に使用されることが期待されています。強化学習は、間接学習と直接学習の 2 つのカテゴリに分けられます。

自動運転技術において、機械学習アルゴリズムの主なタスクの 1 つは、周囲の環境を継続的にレンダリングし、周囲の環境の変化を予測することです。これらは次の 3 つのサブカテゴリに分類できます。

  • 物体検出
  • ターゲット認識またはターゲット識別分類
  • ターゲットの位置決めと動きの予測

機械学習アルゴリズムは、決定行列、クラスタリングアルゴリズム、パターン認識、回帰アルゴリズムの 4 種類に大別できます。それぞれ 2 つ以上のサブタスクに使用できます。たとえば、回帰アルゴリズムは、ターゲットの位置決め、ターゲットの予測、または動作の予測に使用できます。

1. 決定マトリックスアルゴリズム

意思決定マトリックスアルゴリズムは、情報自体と価値の関係を体系的に分析、識別、評価します。これらのアルゴリズムは主に意思決定に使用されます。車がブレーキをかける必要があるか、左折する必要があるかは、所定の信頼度レベルで物体の次の動きを識別、分類、予測するアルゴリズムの能力に基づいて決定されます。決定マトリックス アルゴリズムは、さまざまな観点から独立してトレーニングされた決定モデルで構成されたモデル マトリックスです。利点は、これらの予測を組み合わせて全体的な予測を作成し、意思決定におけるエラーの可能性を減らすことです。 AdaBoosting は最も一般的に使用されるアルゴリズムです。

AdaBoosting(アダプティブブースティングの略)

AdaBoosting は複数の学習アルゴリズムを組み合わせ、回帰や分類に使用できます。他の機械学習アルゴリズムと比較すると、このアルゴリズムは過剰適合の問題を克服しますが、一般的に外れ値やノイズの多いデータに対して敏感です。強力な学習方法を構築するために、AdaBoost は通常、複数の反復処理を実行するため、「適応型」ブースティング アルゴリズムと呼ばれます。 AdaBoosting は、他のブースティング方法と同様に、一部の弱い学習者の学習機能を統合して、強い学習者へと進化させます。アルゴリズムに関して具体的に言えば、AdaBoost は以前の学習者に基づいてサンプルの重みを変更し、以前に誤分類されたサンプルの割合を増やし、正しく分類されたサンプルの割合を減らします。次に、学習者は誤分類されたサンプルに焦点を当てます。その結果、弱学習器よりも精度の高い分類器が得られます。

AdaBoost は、弱いしきい値分類器を強い分類器にブーストするのに役立ちます。上の図は、AdaBoost の実装シナリオを具体的に示しています。弱い分類器は、データを 2 つのカテゴリに分割できるように、データ次元内で理想的なしきい値を見つけようとします。分類器は反復と各分類ステップの後に呼び出され、誤分類された例の重みを変更して、強力な分類器のように動作する弱い分類器のカスケードを作成します。

2. クラスタリングアルゴリズム

特定の状況(たとえば、システムによって収集された画像が鮮明ではなく、位置決めや検出に使用するのが難しい場合や、分類アルゴリズムによって検出オブジェクトが失われる場合など)では、システムはターゲットを分類してレポートを作成することができません。理由としては、データの一貫性の欠如、データ サンプルの少なさ、画像の解像度の低さなどが挙げられます。クラスタリング アルゴリズムは、レイヤーと重心を通じてデータをモデル化し、データの構造を検出するために特別に設計されています。すべての方法は、データの固有の構造を利用してデータを分類し、各データ カテゴリの類似性が最大になるようにすることを目的としています。 K-means クラスタリング、階層的クラスタリング、マルチクラス ニューラル ネットワークが最も代表的なアルゴリズムです。

K平均法クラスタリング

K-means クラスタリングは非常に有名なクラスタリング アルゴリズムです。このアルゴリズムはサンプルを k 個のクラスターにクラスタリングします。ここで、k は各クラスターの k 個の重心点を定義するために使用されます。ある点がクラスターの初期重心に他のどの重心よりも近い場合、その点はクラスター内に存在します。重心点は、現在割り当てられているデータ ポイントとクラスター間のユークリッド距離に基づいて更新されます。データ ポイントをクラスターに割り当てるかどうかは、現在どの重心が配置されているかによって決まります。

K平均法アルゴリズム図

K-means アルゴリズムの概略図。十字は各クラスターの重心を表し、点はトレーニング データを表します。(a) 元のデータ セット (b) ランダムに設定された初期重心 (cf) 2 回の反復後のデータ分布。各トレーニング データは各反復で最も近いクラスター セントロイド ポイントに割り当てられ、データの平均がクラスター セントロイドとして使用され、クラスター セントロイド ポイントが更新されます。

3. パターン認識アルゴリズム(分類)

先進運転支援システム (ADAS) のセンサーによって取得される画像はさまざまな環境データで構成されていますが、物体のカテゴリを決定するには画像をフィルタリングする必要があります。したがって、これを実現するには無関係なデータを除外する必要があります。パターン認識は、オブジェクトを分類する前のデータセットにおける重要なステップです。このタイプのアルゴリズムはデータ削減アルゴリズムと呼ばれます。

データ簡素化アルゴリズムは、オブジェクトのエッジとポリラインを削減するのに役立ちます (線分と円弧に適合)。あるノードでは、集約線とエッジが直線を形成し、その後、新しい集約線が表示されます。円弧や円弧に似た線についても同様です。さまざまな画像の特徴 (円弧や線分) を組み合わせて、オブジェクトの特性を判断します。

PCA (主成分分析) や HOG (方向勾配ヒストグラム) と比較すると、サポート ベクター マシン (SVM) は、先進運転支援システム (ADAS) でよく使用される認識アルゴリズムです。同時に、K近傍法(KNN)やベイズ決定ルールもよく使用されます。

サポートベクターマシン (SVM)

サポート ベクター マシン (SVM) の鍵は、決定境界または分離超平面をどのように定義するかにあります。 SVM の超平面は、最大マージンを維持しながら、異なるカテゴリのデータを分離します。次の図では、データは赤と緑の 2 つのカテゴリに分かれています。超平面は赤と緑のデータを分離します。左に落ちる新しいオブジェクトは赤でマークされ、右に落ちる新しいオブジェクトは緑でマークされます。

IV. 回帰アルゴリズム

このアルゴリズムはイベントを予測するのに非常に適しています。回帰分析は、2 つ以上の変数間の関係を評価し、さまざまなレベルでの変数の影響を検証します。一般的な指標は 3 つあります。

  • 回帰曲線のスタイル
  • 従属変数の種類
  • 独立変数の数

画像信号(カメラまたはレーダー)の起動と配置は、先進運転支援システムにおいて重要な役割を果たします。あらゆるアルゴリズムにとって最大の課題は、画像の特徴の選択と予測に基づいたモデルを開発することです。

画像内のオブジェクトの位置とその画像が与えられると、回帰アルゴリズムは環境の反復的な性質を利用して関係の統計モデルを作成できます。このモデルは画像のサンプリングを可能にし、高速オンライン検出とオフライン学習モードを提供します。また、大規模な手動モデリングを行わずに、他のオブジェクトにさらに拡張することもできます。オブジェクトの存在に関するオンラインのリアルタイム出力とフィードバックとして、アルゴリズムはオブジェクトの位置を自動的に返します。

回帰アルゴリズムは、短期予測や長期学習にも使用できます。自動運転に使用できる回帰アルゴリズムには、決定森回帰、ニューラル ネットワーク回帰、ベイズ回帰などがあります。

ニューラルネットワーク回帰

ニューラル ネットワークは、回帰、分類、または教師なし学習に使用できます。このようなアルゴリズムは、ラベルのないデータを教師なしで分類したり、教師ありトレーニング後に後続の値を予測するために使用したりできます。ニューラル ネットワークでは、連続データを 1 や 0 などの離散変数に変換するために、ネットワークの最後の層としてロジスティック回帰がよく使用されます。

上図からわかるように、「x」は入力データであり、ネットワーク構造の入力層から特徴が伝達されます。各エッジを逆方向に通過するときに、各固有値 'x' に、対応する重み 'w' が乗算されます。すべての積の合計は活性化関数 ReLU に渡され、その結果が非線形分類に使用できるようになります。 ReLU は非常によく使用されます。シグモイド関数とは異なり、浅い勾配条件で飽和する傾向がありません (入力が非常に大きいか非常に小さい場合、ニューロンの勾配は 0 に近くなります。これが発生すると、ほとんどのニューロンが飽和状態になり、勾配が消えて、ネットワークの学習が困難になります)。 ReLU は各隠しニューロンに活性化出力を提供し、それを次の出力ニューロンに渡します。つまり、回帰を実行するニューラル ネットワークには、前のレイヤーからのアクティベーションの合計に 1 を掛ける単一の出力ノードが含まれています。図中のニューラルネットワーク予測「y_hat」が結果です。 『y_hat』はすべてのxマッピングの従属変数です。このようにニューラル ネットワークを使用して、x (複数の独立変数) を y (単一の従属変数) に関連付けることで、連続値の結果を予測します。

元記事: http://www.kdnuggets.com/2017/06/machine-learning-algorithms-used-self-driving-cars.html

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  画像解析アプリケーション向けの大規模サンプルフィルタリングソリューション

>>:  人工知能の歴史 - チューリングテストからビッグデータまで

ブログ    
ブログ    
ブログ    

推薦する

...

ゲームにおけるディープラーニングと AI

[[190049]]この記事は、4月27日にBig Data Talk WeChatコミュニティで...

...

ChatGPTの10の実用的なビジネスユースケース

ChatGPT のビジネスユースケースは数多く登場していますが、組織は自社の特定のニーズに最適なシナ...

グラフディープラーニングで複雑な研究​​タイプのタスクを実装するのは、あまりにも面倒ですか?この新しいツールキットは、

ディープラーニングは、AI分野で最も注目されている分野の1つです。現在、PyGやDGLなどの主流のグ...

ニューラルネットワークの父ヒントン氏は、34年前の画期的な業績を再検証し、脳内のAI手法の「存在」を模索している。

これまで耳にした人工知能の進歩のほぼすべては、30 年前に発表された、多層ニューラル ネットワークを...

...

アルゴリズム実装からMiniFlow実装まで、機械学習のためのインフラプラットフォームを構築

ビッグデータ、クラウドコンピューティング、ディープラーニングと比較すると、インフラストラクチャはあま...

AIとコネクテッドデバイスの急成長が新たなデジタル格差を生み出している理由

接続デバイスと AI 言語モデルの急速な成長により、私たちの生活、仕事、コミュニケーションの方法が変...

2018年に人工知能はどのように発展するでしょうか? 13人の専門家の予測を聞いてみよう

ウォール・ストリート・ジャーナル、フォーブス、フォーチュンなどの出版物は、2017 年を「AI の年...

Tech Neo 11月号: コンテナプラットフォーム管理の実践

51CTO.com+プラットフォームは、オリジナルの技術コンテンツの選択と絶妙なレイアウトを通じて、...

高性能な MongoDB データ移行ツールの構築: Java 開発の実践

ビッグデータ時代の到来により、データ移行は多くの企業や組織が直面しなければならない課題の 1 つにな...

エッジ AI で建物のシステム障害を回避

ビルの管理者や運営者は、暖房や冷房、照明システム、エレベーターの故障など、ビルのシステムや設備の予期...