移転可能で適応性のある運転行動予測

2022年2月10日にarXivにアップロードされた論文「移転可能で適応可能な運転行動予測」は、バークレー大学のものです。

自動運転車が道路上での困難な問題を解決するのは依然として困難ですが、人間は効率的で移転可能かつ適応性のある運転の本質を長い間習得してきました。階層型フレームワークである HATN は、運転中の人間の認知モデルと意味理解を模倣することにより、マルチエージェントの密集した交通環境での運転行動に関する高品質で転送可能かつ適応可能な予測を生成します。この階層的アプローチは、高レベルの意図認識戦略と低レベルの軌跡生成戦略で構成されます。新しいセマンティックサブタスクが定義され、各サブタスクの一般的な状態表現が与えられます。これらの技術により、階層構造をさまざまな運転シナリオ間で転送できます。

さらに、このモデルは、オンライン適応モジュールを通じて、個人やシナリオ間の運転行動の変化を捉えます。オープンソースの INTERACTION データセットでは、交差点やラウンドアバウトの軌道予測タスクを通じてアルゴリズムのパフォーマンスが実証されています。

提案された HATN (階層型適応型転送可能ネットワーク) フレームワークは、次の 4 つの部分で構成されます。

1) 左側では、自車両のインタラクティブ車両を抽出し、セマンティックグラフ（SG）を構築します。 SG では、動的挿入領域 (DIA) はグラフのノードとして定義され、自車両が挿入することを選択することができます。

2) 高レベルのセマンティックグラフネットワーク (SGN) は、SG を入力として受け取り、車両間の関係性を推論し、どのエリアに挿入するか、対応するターゲット状態など、単一の車両の意図を予測する役割を担います。

3) 低レベルのエンコーダーデコーダーネットワーク (EDN) は、各車両の過去のダイナミクスと意図信号を受信し、将来の軌道を予測します。

4) オンライン適応 (OA) モジュールは、個々のシナリオ固有の動作を捉えた過去の予測誤差に応じて、EDN のパラメータをオンラインで適応させます。

図は HATN のブロック図です。

次の表は、HATN の各モジュールの入力と出力を正式に示しています。

各モデルの説明は次のとおりです。

HATNSG (シーングラフ表現) SGNEDNMEKF (修正拡張カルマンフィルタ)

抽出された DIA は、道路上のセルフエージェントによって挿入または進入できる動的領域です。各 DIA は、前部知能によって形成される前部境界、後部知能によって形成される後部境界、および基準線によって形成される 2 つの側方境界で構成されます。この図は、DIA 抽出と SG 構築のプロセスを示しています。他の車両の車線基準線 (Dynamic Time Warping アルゴリズムによって確認) が車両の車線基準線と交差する場合、衝突ポイントに基づいて DIA が抽出され、SG を構築するためのノードと見なされます。

任意の 2 つのノード間の関係を推測するために、Graph Attention Network (GAN) にヒントを得て、注目度ベースの関係推論レイヤーが設計されています。

高レベルのポリシーがどこに向かうかを決定すると、下位レベルのポリシーは、階層化された設計のメリットを活かして、より細かい粒度で情報を処理することでその目標を達成する責任を負います。

1) 車両は自身のダイナミクスのみを気にすればよいため、学習が簡素化され、相互作用、衝突回避、道路形状の考慮は高レベルのポリシー（情報隠蔽）に委ねられます。

2) 戦略は目標（報酬の隠蔽）を達成するためだけに最適化されており、さまざまな対策の効果をより適切に検証できるため、制御可能かつ解釈可能です。

3) 学習した戦略は、さまざまなシナリオに転送して再利用できます。

実際には、高レベルポリシーから予測された意図信号自体が、高レベルポリシーまたはデータ分布からの誤差変動を伴う可能性があります。実験結果によれば、以下の場合に最適なパフォーマンスが達成されます。

1) フレネ座標系では;

2) 速度やヨーなどの入力特徴。

3) 増分予測や位置合わせなどの表現技術を適用する。

4) ターゲット状態やデコード手順などの意図信号を入力機能に追加します。

運転シナリオが異なれば、必然的にさらなる行動の変化が生じます。したがって、オンライン適応（カルマンフィルターに基づく）を利用して、カスタマイズされた個人および状況のパターンをモデルに挿入します。オンライン適応の重要な点は、ドライバーが直接コミュニケーションできないため、過去の行動がドライバーの運転パターンの重要な手がかりとなり、それに基づいてモデルパラメータが調整され、個人やシナリオにより適したものになる可能性があることです。

オンライン適応の背後にある直感は、同じ目標状態が与えられているにもかかわらず、ドライバーにはそれを達成する方法が異なるということです。このようなカスタマイズパターンをキャプチャすると、生成された動作の人間らしさが向上します。アルゴリズム全体の疑似コードは次のとおりです。

次の 3 つの実験シナリオがあります。

1) 自我の乗り物が共通の衝突点を通過するために他の乗り物とどのように相互作用するか（1 つの相互作用）

2) 自我の乗り物が他の乗り物と相互作用して一連の衝突点を通過する方法（一連の相互作用）

3) 再訓練なしでラウンドアバウトのシナリオに移行したときに、自車両が他の車両とどのように相互作用するか（シナリオ転送可能な相互作用）。

シナリオ: 1 つのインタラクションシナリオ: 一連のインタラクションシナリオ: 転送可能なインタラクション

次の 2 つの表は、交差点とラウンドアバウトのシナリオにおける HATN と他の 6 つの方法を比較したものです。

1. 時間領域なし: この方法では履歴情報は考慮されません。つまり、現在の時間ステップ t の情報のみが考慮されます。

2. GAT: この方法では、相対的な特徴ではなく絶対的な特徴を使用してノード間の関係を計算します。このアプローチは、オリジナルの Graph Attention Network (GAN) に対応しています。

3. シングルエージェント：この方法では、自車両の意図予測の損失のみを考慮し、他車両の意図予測は考慮しません。

4. 2 層グラフ: この方法では、情報の埋め込みに 2 層のグラフを使用します。つまり、集約にグラフが 2 回使用されます。

5. マルチヘッド: この方法では、マルチヘッドアテンションメカニズムを使用して学習を安定化します。この方法は、Sec の関係推論に基づいて動作します。 4.2.2 複数の独立した並列操作を実行し、すべての集約された機能を最終的な集約された機能として接続します。

6.Seq グラフ: この方法では、まず各タイムステップでグラフに対して関係推論を実行し、集約されたグラフシーケンスを RNN に送り込んで時間処理を行います。比較すると、私たちの方法では、まず各ノードの履歴特徴シーケンスを RNN に埋め込み、次に現在のタイムステップでの各ノードの非表示状態を使用して、RNN から関係推論を実行します。

いくつかの観察:

1) HATN は交差点とラウンドアバウトで最も低い誤差を実現します。

2) 時間領域情報が不足しているため、非時間領域方式は交差点とラウンドアバウトの両方のシナリオで最悪のパフォーマンスを発揮します。

3) GAT法は、特にラウンドアバウトのシナリオでHATNよりもはるかに高いエラー（58%）を生成し、関係推論では関連する特徴を使用する必要があることを示しています。

4) HATN はシングルエージェント方式よりも優れています。つまり、すべての車両によって生成されたターゲット状態が損失関数に含まれるため、データが増加し、インタラクティブな推論が促進されます。

5) 2層グラフ法はHATNに最も近いが、トレーニング記録によると、深刻な過剰適合がある。

6) マルチヘッド方式は交差点シナリオでは 2 番目に高い精度を達成しますが、ラウンドアバウトシナリオではパフォーマンスが大幅に低下します。これは、慎重な調整や適切なヘッド数の探索によって改善できます。

7) 交差点やラウンドアバウトの場合、Seq Graph 方式は 2 番目に悪い結果になります。これは、過去のやり取りを複雑にエンコードしても予測にはほとんど役立たず、学習が困難になることを意味している可能性があります。

次の表は、意図シグナルの影響を示しています。

次の表は、ルールベースおよび学習ベースの方法と HATN を比較したものです。

<<: 「トランスフォーマー」は5年でクレイジーなCNNに取って代わりました！トランスフォーマーは人工知能を支配するのでしょうか？

>>: CVPR で最も興味深い論文 | AI はぼやけた写真を復元できる

ブログ

ブログ

Big Vsが推奨するAI論文の引用数は倍増するでしょうか？過去5年間の2人のTwitterブロガーのツイートの影響が明らかに

ブログ

コードを自動生成できるAIベースの開発ツール5選

ブログ

移転可能で適応性のある運転行動予測

ポストエピデミック時代のスマートエネルギー管理にエッジAIを活用する方法

チャットボットはデータセンターをよりスリムで効率的にする

Amazon が「AI チケット」を購入するために 40 億ドルを費やす!ユニコーン企業に投資し、ライバル企業から幹部を引き抜く

ディープラーニング、ノイズ除去オートエンコーダを使用して生データを予測する方法は?

Big Vsが推奨するAI論文の引用数は倍増するでしょうか？過去5年間の2人のTwitterブロガーのツイートの影響が明らかに

コードを自動生成できるAIベースの開発ツール5選

推薦する

3億7500万人の労働者が転職する？人工知能が代替できない分野はどれですか?

大学受験出願関連アプリは会員料金が高く、AIアプリは信頼できない

科学者たちはロボットを使って体外でマウスの脳神経を操作します！ 1分以内に通信接続

東京オリンピックでロボットが美しい風景になる

AI時代になっても、あなたのキャリアは存続できるでしょうか?

物理学界に嵐を巻き起こした室温超伝導の論文は、8人の共著者によって報告された後、ネイチャー誌によって撤回された。第一著者は調査中である。

ディープラーニングのこれらの概念をすべて理解できましたか? TF、TLT、TRT、DS....

不妊治療の新たな夜明け：AI

グーグル、規制当局の措置を受けてEUでのチャットボット「バード」のリリースを一時停止

自動運転AIアルゴリズムとマルチセンサー融合技術

Soraはどのように機能しますか?

報告書は、2030年までにサイバーセキュリティの分野でAIが人間に取って代わる可能性があると予測している。