2022年2月10日にarXivにアップロードされた論文「移転可能で適応可能な運転行動予測」は、バークレー大学のものです。 自動運転車が道路上での困難な問題を解決するのは依然として困難ですが、人間は効率的で移転可能かつ適応性のある運転の本質を長い間習得してきました。階層型フレームワークである HATN は、運転中の人間の認知モデルと意味理解を模倣することにより、マルチエージェントの密集した交通環境での運転行動に関する高品質で転送可能かつ適応可能な予測を生成します。この階層的アプローチは、高レベルの意図認識戦略と低レベルの軌跡生成戦略で構成されます。新しいセマンティック サブタスクが定義され、各サブタスクの一般的な状態表現が与えられます。これらの技術により、階層構造をさまざまな運転シナリオ間で転送できます。 さらに、このモデルは、オンライン適応モジュールを通じて、個人やシナリオ間の運転行動の変化を捉えます。オープンソースの INTERACTION データセットでは、交差点やラウンドアバウトの軌道予測タスクを通じてアルゴリズムのパフォーマンスが実証されています。 提案された HATN (階層型適応型転送可能ネットワーク) フレームワークは、次の 4 つの部分で構成されます。 1) 左側では、自車両のインタラクティブ車両を抽出し、セマンティックグラフ(SG)を構築します。 SG では、動的挿入領域 (DIA) はグラフのノードとして定義され、自車両が挿入することを選択することができます。 2) 高レベルのセマンティック グラフ ネットワーク (SGN) は、SG を入力として受け取り、車両間の関係性を推論し、どのエリアに挿入するか、対応するターゲット状態など、単一の車両の意図を予測する役割を担います。 3) 低レベルのエンコーダー デコーダー ネットワーク (EDN) は、各車両の過去のダイナミクスと意図信号を受信し、将来の軌道を予測します。 4) オンライン適応 (OA) モジュールは、個々のシナリオ固有の動作を捉えた過去の予測誤差に応じて、EDN のパラメータをオンラインで適応させます。 図は HATN のブロック図です。 次の表は、HATN の各モジュールの入力と出力を正式に示しています。 各モデルの説明は次のとおりです。 HATNSG (シーングラフ表現) SGNEDNMEKF (修正拡張カルマンフィルタ) 抽出された DIA は、道路上のセルフエージェントによって挿入または進入できる動的領域です。各 DIA は、前部知能によって形成される前部境界、後部知能によって形成される後部境界、および基準線によって形成される 2 つの側方境界で構成されます。この図は、DIA 抽出と SG 構築のプロセスを示しています。他の車両の車線基準線 (Dynamic Time Warping アルゴリズムによって確認) が車両の車線基準線と交差する場合、衝突ポイントに基づいて DIA が抽出され、SG を構築するためのノードと見なされます。 任意の 2 つのノード間の関係を推測するために、Graph Attention Network (GAN) にヒントを得て、注目度ベースの関係推論レイヤーが設計されています。 高レベルのポリシーがどこに向かうかを決定すると、下位レベルのポリシーは、階層化された設計のメリットを活かして、より細かい粒度で情報を処理することでその目標を達成する責任を負います。 1) 車両は自身のダイナミクスのみを気にすればよいため、学習が簡素化され、相互作用、衝突回避、道路形状の考慮は高レベルのポリシー(情報隠蔽)に委ねられます。 2) 戦略は目標(報酬の隠蔽)を達成するためだけに最適化されており、さまざまな対策の効果をより適切に検証できるため、制御可能かつ解釈可能です。 3) 学習した戦略は、さまざまなシナリオに転送して再利用できます。 実際には、高レベルポリシーから予測された意図信号自体が、高レベルポリシーまたはデータ分布からの誤差変動を伴う可能性があります。実験結果によれば、以下の場合に最適なパフォーマンスが達成されます。 1) フレネ座標系では; 2) 速度やヨーなどの入力特徴。 3) 増分予測や位置合わせなどの表現技術を適用する。 4) ターゲット状態やデコード手順などの意図信号を入力機能に追加します。 運転シナリオが異なれば、必然的にさらなる行動の変化が生じます。したがって、オンライン適応(カルマン フィルターに基づく)を利用して、カスタマイズされた個人および状況のパターンをモデルに挿入します。オンライン適応の重要な点は、ドライバーが直接コミュニケーションできないため、過去の行動がドライバーの運転パターンの重要な手がかりとなり、それに基づいてモデルパラメータが調整され、個人やシナリオにより適したものになる可能性があることです。 オンライン適応の背後にある直感は、同じ目標状態が与えられているにもかかわらず、ドライバーにはそれを達成する方法が異なるということです。このようなカスタマイズ パターンをキャプチャすると、生成された動作の人間らしさが向上します。アルゴリズム全体の疑似コードは次のとおりです。 次の 3 つの実験シナリオがあります。 1) 自我の乗り物が共通の衝突点を通過するために他の乗り物とどのように相互作用するか(1 つの相互作用) 2) 自我の乗り物が他の乗り物と相互作用して一連の衝突点を通過する方法(一連の相互作用) 3) 再訓練なしでラウンドアバウトのシナリオに移行したときに、自車両が他の車両とどのように相互作用するか(シナリオ転送可能な相互作用)。 シナリオ: 1 つのインタラクション シナリオ: 一連のインタラクション シナリオ: 転送可能なインタラクション 次の 2 つの表は、交差点とラウンドアバウトのシナリオにおける HATN と他の 6 つの方法を比較したものです。 1. 時間領域なし: この方法では履歴情報は考慮されません。つまり、現在の時間ステップ t の情報のみが考慮されます。 2. GAT: この方法では、相対的な特徴ではなく絶対的な特徴を使用してノード間の関係を計算します。このアプローチは、オリジナルの Graph Attention Network (GAN) に対応しています。 3. シングルエージェント:この方法では、自車両の意図予測の損失のみを考慮し、他車両の意図予測は考慮しません。 4. 2 層グラフ: この方法では、情報の埋め込みに 2 層のグラフを使用します。つまり、集約にグラフが 2 回使用されます。 5. マルチヘッド: この方法では、マルチヘッドアテンションメカニズムを使用して学習を安定化します。この方法は、Sec の関係推論に基づいて動作します。 4.2.2 複数の独立した並列操作を実行し、すべての集約された機能を最終的な集約された機能として接続します。 6.Seq グラフ: この方法では、まず各タイム ステップでグラフに対して関係推論を実行し、集約されたグラフ シーケンスを RNN に送り込んで時間処理を行います。比較すると、私たちの方法では、まず各ノードの履歴特徴シーケンスを RNN に埋め込み、次に現在のタイム ステップでの各ノードの非表示状態を使用して、RNN から関係推論を実行します。 いくつかの観察: 1) HATN は交差点とラウンドアバウトで最も低い誤差を実現します。 2) 時間領域情報が不足しているため、非時間領域方式は交差点とラウンドアバウトの両方のシナリオで最悪のパフォーマンスを発揮します。 3) GAT法は、特にラウンドアバウトのシナリオでHATNよりもはるかに高いエラー(58%)を生成し、関係推論では関連する特徴を使用する必要があることを示しています。 4) HATN はシングルエージェント方式よりも優れています。つまり、すべての車両によって生成されたターゲット状態が損失関数に含まれるため、データが増加し、インタラクティブな推論が促進されます。 5) 2層グラフ法はHATNに最も近いが、トレーニング記録によると、深刻な過剰適合がある。 6) マルチヘッド方式は交差点シナリオでは 2 番目に高い精度を達成しますが、ラウンドアバウトシナリオではパフォーマンスが大幅に低下します。これは、慎重な調整や適切なヘッド数の探索によって改善できます。 7) 交差点やラウンドアバウトの場合、Seq Graph 方式は 2 番目に悪い結果になります。これは、過去のやり取りを複雑にエンコードしても予測にはほとんど役立たず、学習が困難になることを意味している可能性があります。 次の表は、意図シグナルの影響を示しています。 次の表は、ルールベースおよび学習ベースの方法と HATN を比較したものです。 |
<<: 「トランスフォーマー」は5年でクレイジーなCNNに取って代わりました!トランスフォーマーは人工知能を支配するのでしょうか?
>>: CVPR で最も興味深い論文 | AI はぼやけた写真を復元できる
1. 5G上のAI 2022年には産業用AIとAI-on-5G IoTアプリケーションが主流になるで...
太陽光発電と風力発電は急成長しているが、世界の再生可能電力への移行は、気候目標を迅速に達成するにはま...
2020 年には人工知能 (AI) が飛躍的に進歩し、機械学習はこのテクノロジーの最も成功し、広く普...
財務省令第87号では、購入者または購入代理店は入札および入札評価プロセス全体を録画および記録しなけれ...
顔認識は、一般的に肖像認識または顔認識とも呼ばれ、顔の特徴に基づいて人物を識別する生体認証技術です。...
[[425904]] GAN モデルは優れていますが、トレーニング データに対する要件が高すぎるため...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
友達、この英語の単語が何だか知っていますか?超微細珪火山性肺炎。これは45文字からなる世界最長の単語...
新小売、新金融、新エンターテインメントなどの新しい業態の台頭により、ビッグデータの驚異的な力がインタ...
最近、シビチェンがチップスを製造しているというニュースが大きな騒ぎを引き起こしました。 [[2547...
2020 年のサイバーセキュリティは転換点を迎えています。人工知能と機械学習の進歩はサイバーセキュリ...
全国的に人材不足が進む中、テクノロジーは雇用者が厳しい市場で最高の人材を見つけるのに役立ちますが、人...
翻訳者 |ブガッティレビュー | Chonglou最近のゲーム開発の仕事は綱渡りのようなものです。ゲ...