移転可能で適応性のある運転行動予測

移転可能で適応性のある運転行動予測

2022年2月10日にarXivにアップロードされた論文「移転可能で適応可能な運転行動予測」は、バークレー大学のものです。

自動運転車が道路上での困難な問題を解決するのは依然として困難ですが、人間は効率的で移転可能かつ適応性のある運転の本質を長い間習得してきました。階層型フレームワークである HATN は、運転中の人間の認知モデルと意味理解を模倣することにより、マルチエージェントの密集した交通環境での運転行動に関する高品質で転送可能かつ適応可能な予測を生成します。この階層的アプローチは、高レベルの意図認識戦略と低レベルの軌跡生成戦略で構成されます。新しいセマンティック サブタスクが定義され、各サブタスクの一般的な状態表現が与えられます。これらの技術により、階層構造をさまざまな運転シナリオ間で転送できます。

さらに、このモデルは、オンライン適応モジュールを通じて、個人やシナリオ間の運転行動の変化を捉えます。オープンソースの INTERACTION データセットでは、交差点やラウンドアバウトの軌道予測タスクを通じてアルゴリズムのパフォーマンスが実証されています。

提案された HATN (階層型適応型転送可能ネットワーク) フレームワークは、次の 4 つの部分で構成されます。

1) 左側では、自車両のインタラクティブ車両を抽出し、セマンティックグラフ(SG)を構築します。 SG では、動的挿入領域 (DIA) はグラフのノードとして定義され、自車両が挿入することを選択することができます。

2) 高レベルのセマンティック グラフ ネットワーク (SGN) は、SG を入力として受け取り、車両間の関係性を推論し、どのエリアに挿入するか、対応するターゲット状態など、単一の車両の意図を予測する役割を担います。

3) 低レベルのエンコーダー デコーダー ネットワーク (EDN) は、各車両の過去のダイナミクスと意図信号を受信し、将来の軌道を予測します。

4) オンライン適応 (OA) モジュールは、個々のシナリオ固有の動作を捉えた過去の予測誤差に応じて、EDN のパラメータをオンラインで適応させます。

図は HATN のブロック図です。

次の表は、HATN の各モジュールの入力と出力を正式に示しています。

各モデルの説明は次のとおりです。

HATNSG (シーングラフ表現) SGNEDNMEKF (修正拡張カルマンフィルタ)

抽出された DIA は、道路上のセルフエージェントによって挿入または進入できる動的領域です。各 DIA は、前部知能によって形成される前部境界、後部知能によって形成される後部境界、および基準線によって形成される 2 つの側方境界で構成されます。この図は、DIA 抽出と SG 構築のプロセスを示しています。他の車両の車線基準線 (Dynamic Time Warping アルゴリズムによって確認) が車両の車線基準線と交差する場合、衝突ポイントに基づいて DIA が抽出され、SG を構築するためのノードと見なされます。

任意の 2 つのノード間の関係を推測するために、Graph Attention Network (GAN) にヒントを得て、注目度ベースの関係推論レイヤーが設計されています。

高レベルのポリシーがどこに向かうかを決定すると、下位レベルのポリシーは、階層化された設計のメリットを活かして、より細かい粒度で情報を処理することでその目標を達成する責任を負います。

1) 車両は自身のダイナミクスのみを気にすればよいため、学習が簡素化され、相互作用、衝突回避、道路形状の考慮は高レベルのポリシー(情報隠蔽)に委ねられます。

2) 戦略は目標(報酬の隠蔽)を達成するためだけに最適化されており、さまざまな対策の効果をより適切に検証できるため、制御可能かつ解釈可能です。

3) 学習した戦略は、さまざまなシナリオに転送して再利用できます。

実際には、高レベルポリシーから予測された意図信号自体が、高レベルポリシーまたはデータ分布からの誤差変動を伴う可能性があります。実験結果によれば、以下の場合に最適なパフォーマンスが達成されます。

1) フレネ座標系では;

2) 速度やヨーなどの入力特徴。

3) 増分予測や位置合わせなどの表現技術を適用する。

4) ターゲット状態やデコード手順などの意図信号を入力機能に追加します。

運転シナリオが異なれば、必然的にさらなる行動の変化が生じます。したがって、オンライン適応(カルマン フィルターに基づく)を利用して、カスタマイズされた個人および状況のパターンをモデルに挿入します。オンライン適応の重要な点は、ドライバーが直接コミュニケーションできないため、過去の行動がドライバーの運転パターンの重要な手がかりとなり、それに基づいてモデルパラメータが調整され、個人やシナリオにより適したものになる可能性があることです。

オンライン適応の背後にある直感は、同じ目標状態が与えられているにもかかわらず、ドライバーにはそれを達成する方法が異なるということです。このようなカスタマイズ パターンをキャプチャすると、生成された動作の人間らしさが向上します。アルゴリズム全体の疑似コードは次のとおりです。


次の 3 つの実験シナリオがあります。

1) 自我の乗り物が共通の衝突点を通過するために他の乗り物とどのように相互作用するか(1 つの相互作用)

2) 自我の乗り物が他の乗り物と相互作用して一連の衝突点を通過する方法(一連の相互作用)

3) 再訓練なしでラウンドアバウトのシナリオに移行したときに、自車両が他の車両とどのように相互作用するか(シナリオ転送可能な相互作用)。

シナリオ: 1 つのインタラクション シナリオ: 一連のインタラクション シナリオ: 転送可能なインタラクション

次の 2 つの表は、交差点とラウンドアバウトのシナリオにおける HATN と他の 6 つの方法を比較したものです。

1. 時間領域なし: この方法では履歴情報は考慮されません。つまり、現在の時間ステップ t の情報のみが考慮されます。

2. GAT: この方法では、相対的な特徴ではなく絶対的な特徴を使用してノード間の関係を計算します。このアプローチは、オリジナルの Graph Attention Network (GAN) に対応しています。

3. シングルエージェント:この方法では、自車両の意図予測の損失のみを考慮し、他車両の意図予測は考慮しません。

4. 2 層グラフ: この方法では、情報の埋め込みに 2 層のグラフを使用します。つまり、集約にグラフが 2 回使用されます。

5. マルチヘッド: この方法では、マルチヘッドアテンションメカニズムを使用して学習を安定化します。この方法は、Sec の関係推論に基づいて動作します。 4.2.2 複数の独立した並列操作を実行し、すべての集約された機能を最終的な集約された機能として接続します。

6.Seq グラフ: この方法では、まず各タイム ステップでグラフに対して関係推論を実行し、集約されたグラフ シーケンスを RNN に送り込んで時間処理を行います。比較すると、私たちの方法では、まず各ノードの履歴特徴シーケンスを RNN に埋め込み、次に現在のタイム ステップでの各ノードの非表示状態を使用して、RNN から関係推論を実行します。

いくつかの観察:

1) HATN は交差点とラウンドアバウトで最も低い誤差を実現します。

2) 時間領域情報が不足しているため、非時間領域方式は交差点とラウンドアバウトの両方のシナリオで最悪のパフォーマンスを発揮します。

3) GAT法は、特にラウンドアバウトのシナリオでHATNよりもはるかに高いエラー(58%)を生成し、関係推論では関連する特徴を使用する必要があることを示しています。

4) HATN はシングルエージェント方式よりも優れています。つまり、すべての車両によって生成されたターゲット状態が損失関数に含まれるため、データが増加し、インタラクティブな推論が促進されます。

5) 2層グラフ法はHATNに最も近いが、トレーニング記録によると、深刻な過剰適合がある。

6) マルチヘッド方式は交差点シナリオでは 2 番目に高い精度を達成しますが、ラウンドアバウトシナリオではパフォーマンスが大幅に低下します。これは、慎重な調整や適切なヘッド数の探索によって改善できます。

7) 交差点やラウンドアバウトの場合、Seq Graph 方式は 2 番目に悪い結果になります。これは、過去のやり取りを複雑にエンコードしても予測にはほとんど役立たず、学習が困難になることを意味している可能性があります。

次の表は、意図シグナルの影響を示しています。

次の表は、ルールベースおよび学習ベースの方法と HATN を比較したものです。

<<:  「トランスフォーマー」は5年でクレイジーなCNNに取って代わりました!トランスフォーマーは人工知能を支配するのでしょうか?

>>:  CVPR で最も興味深い論文 | AI はぼやけた写真を復元できる

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

3億7500万人の労働者が転職する?人工知能が代替できない分野はどれですか?

人工知能は急速に発展しています。データによると、2016年から2020年にかけて、中国の人工知能市場...

大学受験出願関連アプリは会員料金が高く、AIアプリは信頼できない

6月26日のニュース:大学入試願書の記入は毎年大学入試後の重要なステップであり、受験生や保護者が最も...

科学者たちはロボットを使って体外でマウスの脳神経を操作します! 1分以内に通信接続

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

東京オリンピックでロボットが美しい風景になる

[[413763]]最近、4年に一度のオリンピックがついに東京で開催されました。フィールドでは、世界...

AI時代になっても、あなたのキャリアは存続できるでしょうか?

人工知能(AI)技術はどこまで発展したのでしょうか? [[278665]]将来、AIが社会に本格的に...

物理学界に嵐を巻き起こした室温超伝導の論文は、8人の共著者によって報告された後、ネイチャー誌によって撤回された。第一著者は調査中である。

多くの紆余曲折を経て、室温超伝導に関する熱狂は2023年末にようやく終焉を迎えた。 11月7日、ネイ...

ディープラーニングのこれらの概念をすべて理解できましたか? TF、TLT、TRT、DS....

最近、NVIDIA GPU 製品や SDK を使用してディープラーニングを学習している学生に多く出会...

不妊治療の新たな夜明け:AI

世界初の試験管ベビーは1978年に英国で誕生した。それ以来、人工生殖技術は継続的に改良されてきました...

グーグル、規制当局の措置を受けてEUでのチャットボット「バード」のリリースを一時停止

グーグルは6月14日、欧州連合(EU)の主要データ規制当局がプライバシーに関する懸念を表明したため、...

自動運転AIアルゴリズムとマルチセンサー融合技術

高度な自動運転は、周囲の環境を高いレベルで認識し、人間の介入をほとんどまたはまったく必要とせずに車両...

Soraはどのように機能しますか?

翻訳者 |ブガッティレビュー | Chonglou先週、 OpenAIチームは、物理世界の基本的な側...

...

...

報告書は、2030年までにサイバーセキュリティの分野でAIが人間に取って代わる可能性があると予測している。

新型コロナウイルス肺炎の流行は社会全体の生産と生活に影響をもたらしています。企業は、感染拡大の影響を...