LiDARとTexas Instrumentsチップを搭載した最新のL3自動運転アーキテクチャの分析

LiDARとTexas Instrumentsチップを搭載した最新のL3自動運転アーキテクチャの分析

画像出典: インターネット

来年発売されるヒュンダイG90とGV80は、ヒュンダイのL3自動運転モデル​​となる。もちろん、L3自動運転はオプションだ。写真にはテストプロトタイプ車が写っており、2 つの LiDAR がはっきりと確認できます。

G90自動運転スパイ写真

画像出典: インターネット

韓国ソウルで撮影されたG90自動運転車のスパイ写真です。レーザーレーダーは後から追加されたようです。

レーザーレーダーを搭載したG90のスパイ写真

画像出典: インターネット

標準G90スパイ写真

画像出典: インターネット

現代自動車の世界販売台数は600万台以上を維持している。2020年の販売台数は12%減少したが、それでも635万台に達した。アライアンスではなく単一メーカーとしてカウントすると、現代自動車の販売台数は3位で、4位のゼネラルモーターズをわずかに上回る。そのため、現代自動車の自動運転は依然として注目に値する。

画像出典: インターネット

L3自動運転のセンサーレイアウトは上記の通りです。 LiDARに関して言えば、現代自動車の子会社である現代モービスはかつて、ベテランLiDAR企業であるベロダインに5000万ドルを投資し、ベロダインと共同で低価格のLiDARを開発・量産したことがある。現代モービスはベロダインのLiDARを外注していたが、そのプロセスは比較的遠かった。現代自動車はベロダインのLiDARではなく、より古いヴァレオLiDAR、第2世代のスカラを選択した。

画像出典: インターネット

より詳細なパラメータは次のとおりです。

画像出典: インターネット

有効距離のパラメータは、数百メートルとだけ言うほとんどのメーカーとは異なり、特に正確です。制限条件のないパラメータは意味がありません。正面では、デュアル LIDAR 用に特別に設計され、スキャン密度が向上しました。

画像出典: インターネット

L3 システムのコンピューティング アーキテクチャを上の図に示します。ほとんどのメーカーとは異なり、ヒュンダイのソリューションは低コストを目指しています。フロントビューカメラ FR CMR も、一般的なイーサネットや SerDes ではなく、CAN-FD バスを使用して接続されています。そのため、ピクセルは非常に低くする必要があり、150 万ピクセル以下と推定されます。 FR RDR は前方メインミリ波レーダー、FR C RDR と RR C RDR は 4 コーナーミリ波レーダーです。 FR C LDR LH は左側のレーザー レーダー、FR C LDR RH は右側のレーザー レーダーです。 CCIC は、中央制御と計器を統合したコックピット ディスプレイ画面です。CCU は実際には TCU であり、OTA アップグレードに使用されます。韓国語でマークされているものはデバッグ用であり、量産時には存在しません。 PHY は物理層チップで、おそらく Marvell の 88Q211 で、7 つの PHY を使用し、価格は約 105 ~ 140 米ドルです。 2 つのイーサネット スイッチ (おそらく Marvell の 88Q5050)。 MCUはInfineonのTC397XPですが、現在深刻な品不足に陥っています。

L3でありながら、電源系統が2系統あるデュアルシステム設計です。他のメーカーに変更すると、間違いなくL4だと言われます。右側のボックスがプライマリシステム、左側のボックスが緊急バックアップシステムです。実は3セットあって、自動駐車用に1セットあります。このシステムは、ヒュンダイとアプティブの合弁会社であるMotionalによって設計・製造される予定だ。

画像出典: インターネット

まずはバックアップシステムから見ていきましょう。CPUはIntelのDenverton、つまりAtom C3000シリーズです。C3000シリーズには16コアのモデルがC3950、C3955、C3958の3つしかありません。このうち、C3950 は TDP 電力がわずか 24 ワットと最も低く、C3958 は 31 ワット、C3955 は 32 ワットです。Hyundai は C3958 を選択する可能性が高いでしょう。 C3000シリーズは主に自動車分野ではなくIoT分野を対象としており、A3900シリーズは自動車分野を対象としています。ただし、この 2 つは非常に類似しており、どちらも Atom3000 シリーズに属します。 A3900 シリーズとは異なり、C3000 シリーズには GPU は搭載されておらず、CPU のみが搭載されています。 C3950 の現在の小売価格は約 160 ドルで、まとめ買いの場合は約 100 ドルになると推定されています。

4コア@2.0GHzのA3950のCPU演算能力は42160 DMIPSで、C3958は16コア@2.0GHzで演算能力は168.6Kになるはずで、Qualcommの5nm SA8295よりわずかに高いですが、C3958は14nmです。さらに、X86 のアウトオブオーダー実行能力は ARM よりもはるかに高くなっています。DMIPS は同等ですが、実際のパフォーマンスでは X86 の方が優れている場合がよくあります。 BMWのL3システムも、16コアと推定されるDenvertonを選択しました。従来のLIDAR ICPアルゴリズムでは、主にCPU出力に依存しているため、Denvertonが選択された理由かもしれません。

メインシステムのコアコンポーネントは、テキサス・インスツルメンツ社がADASと自動駐車用に発売したチップ「Texas Instruments TDA4VMID」です。現在、量産されているのはTDA4VMIDの1モデルのみです。2022年上半期にサンプルがリリースされる予定のモデルは他に2つあり、1つはTDA4VMID Plus、もう1つはTDA4VLowです。 1 つのチップの計算能力が不十分な場合は、4 つのチップを並列に接続できます。

画像出典: インターネット

2022年には、テキサス・インスツルメンツは同社の主力チップであるTDA4AHのサンプルも提供する予定だ。同チップは、100KDMIPSの演算能力を持つ8個のA72@2.4GHz、36TOPS@INT8の演算能力を持つ4個のMMA、320GFLOPSの演算能力を持つ4個のC7x DSPを搭載している。

TDA4VMID内部フレームワーク図

画像出典: インターネット

TDA4VMID は、約 25KDMIPS の計算能力を持つ 2 つの A72、8TOPS の計算能力を持つ 1 つの MMA、80GFLOPS の計算能力を持つ 1 つの C7x DSP、および 100GFLOPS の計算能力を持つ 1 つの GE8430 を使用します。ボードから判断すると、最新の L3 は 4 つの TDA4VMID を使用し、CPU の合計計算能力は 100K、NPU は 32TOPS になるはずで、これはかなり優秀です。

画像出典: インターネット

3 つの ARM Cortex-R5F リアルタイム ロックステップ システムにより、チップ全体が ASIL-D レベルに到達できます。

画像出典: インターネット

Vector によって開発された、基盤となる抽象化レイヤー MCAL に関連付けられた Autosar ドライバーがプリインストールされています。

画像出典: インターネット

ゲートウェイ、セーフティ アイランド、OTA、V2X、診断、IPC 通信など、KPIT が開発した AUTOSAR がプリインストールされています。

画像出典: インターネット

ディープラーニングに関しては、Texas Instruments 社は、Microsoft 社のオープン ニューラル ネットワーク エクスチェンジ ONNX を中心とした 3 つの主要な推論ディープラーニング モデルを最適化する TI Deep Learning (TIDL) を開発しました。ハードウェアの面では、DSP は MMA (行列乗算アクセラレータ) を追加します。

DSP は、ディープラーニングにおいて、NPU などのアクセラレータでは対応できない利点を持っています。つまり、DSP は、メモリ空間を 2 つに分割し、それぞれ命令とデータを格納するハーバード構造を採用しています。プロセッサ コアに接続された 2 セットのバスがあり、同時にアクセスでき、各メモリは独立してアドレス指定され、独立してアクセスされます。この配置により、プロセッサのデータ スループットが 2 倍になり、さらに重要なことに、データと命令の両方がプロセッサ コアに同時に提供されます。

このレイアウトにより、DSP はシングルサイクル MAC 命令を実装できます。 DSPを除いて、NPUは一般的にノイマンアーキテクチャを採用しています。データとプログラムはバスとストレージスペースを共有します。ディープラーニング推論の畳み込み演算では、1つの命令が同時に2つのオペランドを取ります。パイプライン処理中に、命令フェッチ操作もあります。プログラムとデータが1つのバスを介してアクセスされる場合、命令フェッチとデータフェッチは必然的に競合し、計算量の多いループの実行効率に非常に不利になります。

ハーバード構造は、基本的に命令フェッチと数値フェッチ間の競合問題を解決できます。ストレージのボトルネックがなく、自然にパイプライン化されたアーキテクチャです。結局、DSP のディープラーニング推論アクセラレーションの計算能力はほぼ膨らんでいるのに対し、NPU 専用のディープラーニング推論アクセラレーションは不安定で、ハードウェアとソフトウェアが統合された高度なカスタマイズが必要です。そのアーキテクチャ向けに開発されたあるモデルではアクセラレータの使用率は 90% ですが、別のモデルでは 10% や 5% にしかならないこともあります。たとえば、NVIDIA の Orin は理想的な計算能力が 254TOPS ですが、モデルによっては計算能力が 12.7TOPS まで低下します。実際には、ストレージのボトルネックを考慮すると、フォン・ノイマン・アーキテクチャのアクセラレータは理想値の 80% に到達できません。 DSP は汎用性が高く、どのモデルでも 90% の使用率を誇ります。

最新の L3 システムは、ディープラーニングの計算能力に依存せず、CPU と従来の決定論的かつ説明可能なアルゴリズムに依存しています。その信頼性は、ディープラーニングなどの不確実で説明不可能なアルゴリズムに依存する自動運転システムよりもはるかに高くなっています。

TDAV4MIDのビジュアルアクセラレーションパイプライン

画像出典: インターネット

<<:  自動運転システムのテストに関する簡単な説明

>>:  バイナリ検索アルゴリズムと時間計算量について簡単に説明し、バイナリ検索アルゴリズムを実装する

ブログ    
ブログ    

推薦する

Googleの検索アルゴリズムがユーザーをより深く理解する方法

Googleは現在、コア検索アルゴリズムに変更を加えており、検索結果の最大10分の1のランキングに影...

CPUのみを使用して自律航行船を開発、実際に実現

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

強いAIと弱いAIの議論:人工知能の意識に関する興味深い理論

[[344692]]最近、私のお気に入りの新進思想家の一人と高性能 AI と低性能 AI について議...

「ハードコア」AIが私たちの家庭に導入されるまでにはどれくらいの時間がかかるのでしょうか? 最先端技術には依然としてブレークスルーが必要

お腹が空いたら、キッチンロボットがミシュランレストランの基準に匹敵するステーキを調理します。運転した...

12 の主要な AI ホットテクノロジーの方向性を網羅する、AISummit グローバル人工知能テクノロジーカンファレンス 2022 が開催されます。

人工知能は、60年以上にわたる発展の中で、数々の浮き沈みを経験してきました。近年、モバイルインターネ...

TensorRT はどのようにしてより高速なアーキテクチャを実現するのでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ディープラーニングが世界に浸透し、世界を変えるほど強力なのはなぜでしょうか?

[[190140]]子供の頃、果物、動物、車、その他のものを認識することを学び始めたときのことを覚...

手書き認識のための単層基本ニューラルネットワーク

[[214992]]まず、コードテンソルフローをインポートする tensorflow.example...

...

GPT-4 はチューリングテストに合格しませんでした。 60年前、古いAIはChatGPTに勝利しましたが、人間の勝率はわずか63%でした。

長い間、「チューリングテスト」は、コンピュータが「知性」を持っているかどうかを判断するための中心的な...

...

...

LLaMA-v2-Chat と Alpaca: 異なる AI モデルはいつ使用すべきですか?

翻訳者 |李睿レビュー | Chonglou今日、大規模言語モデル (LLM) は、言語生成から画像...

AIを活用したスト​​レージ施設は、企業がデータを最大限に活用するのに役立ちます

AI を活用したスト​​レージにより、企業はデータを迅速かつインテリジェントに分析し、ほぼ瞬時に洞察...

WeChat AIがHPおよびIntelと提携し、PC向け人工知能音声アシスタントを開発

9月9日、テンセントグローバルデジタルエコシステムカンファレンスの「WeChat新成長発見」特別イベ...