ここ数年、自動運転車に対する熱狂が高まっています。これは確かに合理的です。自動運転車は、燃費の向上、移動時間の短縮、乗客の体験と仕事の生産性の向上、運転できない高齢者や障害者の負担軽減、そして最も重要な道路安全性の向上など、広範囲にわたるメリットをもたらすと期待されています。 手頃な価格の完全自動運転車に対する熱意にもかかわらず、技術的な複雑さ、コスト、規制上の課題により、自動運転車の主流への導入は繰り返し遅れています。インテリジェンス、自動化、モバイル コンピューティング プラットフォーム...これらのキーワードは、未来の自動車に対する私たちの想像力をかき立てます。自動車製造業界のすべての企業がこの変化を推進しています。 2022年に何が起こるのかと聞かれたら?知るか? しかし、一つ確かなことは、2022年には自動車業界における軍拡競争が急速に激化するだろうということです。
コンピューティングパワーの競争が本格化 かつて、ボッシュ、コンチネンタル、デルファイ、ZF...これらの国際的な大手企業や一流サプライヤーは、国内の自動車メーカーが尊敬していた企業でした。彼らは車両全体の最も中核的な技術を掌握しており、絶対的な交渉力を持ち、彼らの開発の進捗状況さえも車両モデルの研究開発サイクルを直接決定します。パワートレインからシャーシまで、大手ティア1企業はこれらの従来の自動車用電子製品において比類のない競争力を持っています。 自動運転の時代において、大手ティア1企業の戦略は、アルゴリズム能力の不足という共通の欠陥が明らかになったため、徐々に効果がなくなってきています。 ADASはここ2年でハイライトを迎えた。クラウドを独占するNvidiaに加え、HuaweiやQualcommといった大手の参入、HorizonとBlack Sesameの競争、さらにはCambrianの参入が業界から大きな注目を集めている。コンピューティング能力の継続的な向上により、大手自動車メーカーはコンピューティング能力の「軍拡競争」に参入することを懸念している。 このコンピューティング能力の「軍拡競争」の最も直接的な原動力は、自動車会社の独自のコンピューティング プラットフォーム (チップ) のコンピューティング能力不足の問題が徐々に顕著になってきたことです。
この段階で、自動車業界はチップメーカー主導のコンピューティング能力競争の時代に突入しました。
大手チップ企業の間では、コンピューティング能力をめぐる競争がひそかに始まっています。TOPS コンピューティング能力を追求することは本当に重要なのでしょうか? チップの計算能力を単純に積み重ねるだけで目標を達成できるのでしょうか? 業界は「コンピューティングパワーのみ」という誤解に陥っているようです。 計算能力では自動運転は実現できない ADAS と自動運転技術の台頭、そしてソフトウェア定義車の段階的な深化により、スマートカーのコンピューティング能力と大量のデータ処理能力に対する需要が急増していることは否定できません。従来の自動車のチップ「スタッキング」ソリューションは、もはや自動運転のコンピューティング能力の要件を満たすことができません。 チップは、現代の科学技術産業とデジタル経済のインフラを統合するものであり、最も複雑で最先端かつ洗練された基礎技術と、ハイエンドの人材と資金を結集しており、間違いなく将来の競争の焦点となるでしょう。 これらのチップは、最終的には自動車会社の車載コンピューティング プラットフォームに利用されることになります。業界が考える必要がある質問の 1 つは、「ソフトウェア定義車」の場合、インテリジェント運転システム コンピューティング プラットフォームのサポート問題は、チップ コンピューティング パワー スタッキングによってのみ解決できるのかということです。 私たちが注目すべきなのはチップの計算能力だけでしょうか?明らかにそうではありません。 ハードウェアの改善は重要ですが、「計算能力のみ」という悪循環に陥ってはなりません。 「データは生産手段である」と言いますが、データ処理を実現するチップはツールです。ツールがコアになることは不可能です。ツールは不可欠ですが、より重要なのはツール上で実行されるソフトウェアです。 チップはソフトウェアの舞台です。チップの品質を測る基準は、チップ上のソフトウェアがその機能を最大限に発揮できるかどうかで決まります。もちろん、これはコンピューティング能力が重要ではないという意味ではありません。コンピューティング能力とソフトウェアの間には効果的な組み合わせが必要です。同じ計算能力を持つ 2 つのチップを比較した場合、ソフトウェアをより効率的に実行できるチップが「優れたチップ」です。 計算能力の実際の値を決定する最も重要な要素は、メモリ (SRAM および DRAM) の帯域幅、実際の動作周波数 (電源電圧または温度)、およびアルゴリズムのバッチ サイズです。
なぜこのようなことが起こるのでしょうか?これには、MAC コンピューティング効率の問題が関係します。 アルゴリズムまたは CNN 畳み込みに必要な計算能力が 1TOPS で、コンピューティング プラットフォームの計算能力が 4TOPS の場合、利用効率はわずか 25% です。特にバッチ サイズが小さい場合、コンピューティング ユニットはほとんどの時間、データ転送を待機しています。このとき、ストレージ帯域幅が不十分だと、パフォーマンスが著しく制限されます。ただし、プラットフォームの計算能力を超えると、レイテンシが大幅に増加し、ストレージのボトルネックも同様に致命的になります。効率が 90 ~ 95% の場合、ストレージのボトルネックの影響は最小限になりますが、これは影響がないことを意味するのではなく、影響は依然として存在します。ただし、プラットフォームは 1 つのアルゴリズムだけで動作するわけではなく、計算効率が 90 ~ 95% で安定することはないでしょう。これが、ほとんどの人工知能アルゴリズム企業がコンピューティング プラットフォームをカスタマイズしたり、独自のコンピューティング プラットフォームを作成したりしたい主な理由です。コンピューティング プラットフォーム メーカーも、一致するアルゴリズムを立ち上げる必要があります。ソフトウェアとハードウェアは統合されており、分離が困難です。 自動運転をめぐる戦いは、本質的にはソフトウェアとハードウェアのプラットフォーム間の戦いです。単一チップ TOPS の計算能力は重要な指標ですが、唯一の指標ではありません。自動運転は、車両、道路、クラウド、エッジ間の調整を必要とする複雑なシステムです。したがって、競争はチップだけではなく、ソフトウェアとハードウェア、プラットフォーム、ツール チェーンなどの調整についても行われます。 自動運転チップの競争上の障壁は、コンピューティング能力の利用と可用性にあります。チップメーカーは、ソフトウェアに基づいて基盤となるハードウェアサポートを提供し、車両設計においてより高い価値を提供し、サプライチェーンにおいてより強い交渉力を持っています。テスラが自社開発した自動車用中央コンピューティング設備と比較すると、オープンなソフトウェアおよびハードウェア プラットフォーム ソリューションには大きな可能性があります。 PC 時代の WinTel アライアンスを例に挙げてみましょう。WinTel アーキテクチャでは、Intel チップと Windows オペレーティング システムが連携して、高度な市場シェアの独占を実現しています。どちらも不可欠というわけではありません。 百度の元社長、陸奇博士は「マザーエコシステム」という概念を提唱した。スマートカーはPCやスマートフォンに次ぐより大きなマザーエコシステムとなり、中国の自動車産業やテクノロジー産業にとって最大のチャンスとなるだろう。さらに、チップが位置するテクノロジー業界が徐々に成熟しつつある兆候の 1 つは、完全なエコシステムが形成されていることです。 自動車会社にとっては、チップコストの問題もあります。計算能力は重要である一方、非常に高価です。関連機関の評価によると、車載グレードのAIチップ、つまりL2+またはL3 AIチップの製造コストは約5億~7億ドルで、2~3年かかるという。 コンピューティング能力の軍拡競争はすでに始まっていますが、チップのコンピューティング能力は本質的にはインテリジェント運転システムにとって必要条件ではあっても十分条件ではありません。現在話題になっているコンピューティング能力は、ピークコンピューティング能力です。 10TOPS の計算能力を持つと主張する最適化されていないチップをよく見かけますが、そのチップで実際に実行されるアプリケーションは 3~4TOPS の計算能力にしか相当しません。 現在のトレンドは「L4 ハードウェア + L2 ソフトウェア」であり、まずハードウェアを「事前組み込み」して標準を満たすか上回り、その後ソフトウェアをゆっくりと蓄積していきます。しかし、一方で、これは無駄ではないでしょうか?残念ながら、TOPS はすべて慎重に使用する必要があります。 チップのコンピューティング能力と組み込みハードウェアの無制限の拡張は、将来のトレンドではありません。ハードウェアも現実に合わせる必要があります。業界関係者は次のように述べています。「特にSoCでは、電子および電気アーキテクチャの変化に適応するために、正確で効率的なコンピューティング能力が必要です。」 さらに、自動車会社が直面する消費者側には、このようなハイエンドのコンピューティング能力が直ちに必要でしょうか?必ずしもそうではありません。 自動運転の計算能力は主に知覚の統合に反映されます。L3では100〜200で十分ですが、L4では200〜300が必要になる場合があります。重要なのは計算能力をどのように使用するかです。多ければ多いほど良いです。1000をやりたい場合は、実際には必要ありません。また、高い計算能力には、高い消費電力と低い利用率の問題が伴います。 高い電力消費と低い利用率がますます顕著になってきている コンピューティング能力が無限に成長できるとは言えず、チップのPPA(消費電力、コスト、面積)はすべて非常に重要です。 これは、車載用 AI チップの場合、コンピューティング能力の指標も重要ですが、エネルギー効率の方がより重要だからです。従来のチップ業界では、PPA は最も古典的なパフォーマンス測定指標です。しかし、自動運転のためのコンピューティングパワーの追求により、業界が依然として「ピークコンピューティングパワー」をAIチップを測定する主な指標とみなす場合、偏った「コンピューティングパワーのみの理論」につながることになります。 チップを評価する次元に関しては、実際にはいくつかの指標があります。
電力消費と電力利用には 2 つの概念があります。
Nvidia のチップを例にとると、その GPU の電力消費量が最も高くなります。オリンとザビエルの使用率は基本的に30%で、どのように最適化しても基本的に30%です。 Nvidia の GPU ソリューションとは異なり、Qualcomm、Mobileye、Huawei、国内のスタートアップ企業はすべて ASIC ルートを採用しています。 ASIC チップはさまざまなニューラル ネットワーク モデルに最適化されており、基本的に 60% から 80% の精度を達成できます。高性能なものでは 80% 以上の精度を達成できる場合もあります。 携帯電話分野では、Nvidia は基本的に Qualcomm に負けており、PC 分野では、Nvidia は Intel に負けています。プロフェッショナル チップの分野では、NVIDIA は実際にはそれほど多くの成功事例や経験を持っておらず、これは本質的に GPU エコシステム全体に関連するものです。現時点では、オペレーター ライブラリの豊富さも含め、NVIDIA の開発ツールはすべて非常に優れています。お客様がNvidiaチップを使用すると、電力消費と使用率を除いてすべてがスムーズに進みます。つまり、現在、NVIDIA は業界全体の中で繁栄した段階で存在することができていますが、将来的には市場で確実に衰退するでしょう。 利用率や消費電力などの主要指標に関して、著者は、クアルコムが2024年から2025年までの3年間で大きな市場シェアを獲得する可能性があると予測しています。 同時に、国内のスタートアップ企業にとっては、こうしたユーザーの悩みを起点に市場を獲得するチャンスでもある。 Horizon は、チップの実際の AI パフォーマンスを評価するための新しい方法である MAPS (Mean Accuracy-guaranteed Processing Speed) を提案しました。業界内で統一された評価基準がないため、これは現時点では単なる一個人の意見に過ぎません。 しかし、消費電力の面では、Horizon は依然として大きな優位性を持っています。 2020年に初めて商業的に量産されたチップであるHorizonのJourney 2チップを例にとると、独自に開発されたコンピューティングアーキテクチャBPU2.0(Brain Processing Unit)を搭載しており、通常の消費電力はわずか2ワットで、4TOPS以上の同等のコンピューティングパワーを提供できます。さらに、TOPSあたりのAI機能出力は、同じコンピューティングパワーのGPUの10倍以上に達することができます。 自動車会社にとって、自動運転コントローラーのチップの最高性能モードでの消費電力レベルが高い場合、それ自体の性能が優れていても、指数関数的に増加する発熱や指数関数的に増加する消費電力など、予測できない潜在的な危険を引き起こす可能性があります。これらの結果は、間違いなくスマート電気自動車にとっての「地雷」です。 高性能AIチップの致命的な打撃 現在、自動運転の分野で使用されている視覚認識アルゴリズムは、基本的に畳み込みニューラルネットワークに基づいており、視覚アルゴリズムの動作は本質的に畳み込み演算の繰り返しです。この計算は複雑ではありません。本質的には、加算、減算、乗算、除算、つまり乗算と累積の演算のみが含まれます。ただし、この単純な操作は畳み込みニューラル ネットワークに大量に存在し、プロセッサのパフォーマンスに高い要求を課します。 ResNet-152を例に挙げましょう。これは152層の畳み込みニューラルネットワークです。224×224の画像を処理するのに必要な計算能力は約226億回です。このネットワークで1080P 30フレームカメラを処理する場合、必要な計算能力は1秒あたり33兆回にも達し、膨大な量になります。 実際、自動運転の分野における視覚データの99%は、AI処理においては役に立たない背景です。これは幽霊を検出するようなものです。変化する領域はほんの一部ですが、従来の視覚処理では、変化していない背景領域の 99% を処理する必要があります。これにより、多くの計算能力が浪費されるだけでなく、時間も浪費されます。あるいは、砂の中にダイヤモンドがあるように、AI チップや従来のカメラはダイヤモンドをふるいにかけるために砂の粒子をすべて識別する必要がありますが、人間は一目見るだけでダイヤモンドを検出できます。AI チップや従来のカメラは、人間の 100 倍から 1,000 倍の時間がかかります。 イベント カメラの動作メカニズムは、ピクセルの明るさが特定のしきい値に変化すると、カメラが上記の形式でイベントを送り返すというものです。最初の 2 つの項目はイベントのピクセル座標、3 番目の項目はイベントのタイムスタンプ、最後の項目の極性は 0、1 (または -1、1) で、明るさが低から高に変化するか、高から低に変化するかを表します。これは、正または負のイベント、またはオンまたはオフのイベントと呼ばれることがよくあります。 このように、カメラの視野全体の中で、ピクセル値に変化があれば、イベントが送り返されます。これらのイベントはすべて非同期で発生するため(時間間隔がどれだけ短くても、完全に同時に発生することは不可能)、イベントのタイムスタンプは異なります。シンプルな伝送のため、従来のカメラと比較して、低遅延という特徴があり、非常に短い時間間隔でピクセルの変化を捉えることができます。遅延はマイクロ秒単位です。 イベントカメラは人間の目や動物の視覚にヒントを得たもので、シリコン網膜とも呼ばれています。生物の視覚は変化がある部分にのみ敏感です。例えば、物体が突然目の前に落ちてきた場合、人間の目は背景を無視して物体に焦点を合わせます。イベントカメラの目的は、イベントや変化の発生を捉えることです。従来の視野では、カメラから送り返される情報は同期しています。いわゆる同期とは、ある瞬間 t に、カメラがその瞬間のマトリックス内のすべてのピクセルを露光して埋め、送り返すことで、写真が生まれることを意味します。写真内のすべてのピクセルは同じ瞬間に対応します。ビデオの場合、それは単なる画像のフレームの集まりです。隣接する画像間の時間間隔は、大きくても小さくてもかまいません。これは、フレーム レート (フレーム レート) と呼ばれることが多く、時間遅延とも呼ばれます。イベントカメラは人間の脳や目に似ており、無関係な背景をスキップしてシーンの核心を直接認識し、データではなく純粋なイベントを作成します。 冗長な情報が削減され、遅延がほとんどないという利点に加えて、イベント カメラの利点は、遅延が少ないため、従来のカメラでは高速の物体を撮影するときに (露出時間により) ぼやけが生じますが、イベント カメラではぼやけがほとんど生じないことです。そして、真のハイダイナミックレンジがあります。イベントカメラの特性により、従来のカメラは強い光や弱い光(高露出と低露出)の環境では「盲目」になりますが、ピクセルの変化は依然として存在するため、イベントカメラは目の前にあるものを見ることができます。 従来のカメラのダイナミック レンジは、アンプが線形範囲であるため、広げることができません。低照度に対応している場合、高照度には適応できません。逆に、高照度に適応している場合、低照度には適応できません。イベントカメラはターゲット追跡や動作認識などの分野で圧倒的な優位性があり、特に自動運転の分野に適しています。 空中のボールの軌道、 ボールを投げて、2 台のカメラの軌道記録を見てみましょう。 イベントカメラの出現は、ハイコンピューティングAIチップにとって致命的な打撃です。イベントカメラは、従来のハイコンピューティングAIチップの1%または0.1%のコンピューティング能力で完璧に動作し、消費電力はミリワットレベルです。イベント カメラは、フレームごとに個々のピクセルを処理するのではなく、パイプライン化されたタイムスタンプに基づいてデータを処理します。従来の畳み込みアルゴリズムは役に立たない可能性があり、AI チップが最も得意とする乗算および累算演算も役に立たない可能性があります。歩行者を正確に検出し、その進路を予測するには、少なくとも 10 フレーム、つまり 330 ミリ秒の複数フレームの処理が必要です。これは、関連システムが効果的な検出を行うために数百ミリ秒かかる可能性があることを意味します。時速 60 キロメートルで走行する車両の場合、5.61 メートルを移動するのに 330 ミリ秒かかりますが、イベント カメラは理論上 1 ミリ秒を超えません。 テクノロジールートの展望 中国の自動運転は、3つの主流技術ルートを示しています。
テスラの現在の最上位FSDには、解像度がわずか130万画素のカメラが8台搭載されており、144TOPSの計算能力が必要です。しかし、Nvidiaの現在の自動運転テスト車両に使用されているカメラはすでに800万画素であるため、1000TOPSの計算能力が必要です。このような大きな計算能力は、コストが高くなるだけでなく、発熱も高くなります。採掘できなければ無駄になります。 今年1月初旬、スウェーデンのスタートアップ企業Terranetは、自動車業界大手のダイムラー・メルセデス・ベンツからVoxelflowのプロトタイプの購入注文を3万1000ユーロで獲得したと発表した。この注文は、2020年10月にテラネットとダイムラーの間で締結された覚書(MoU)の延長であり、ADASおよび衝突回避ソリューションの試作、製品開発、産業化をカバーしています。次のステップは、VoxelFlow をメルセデス・ベンツのテスト車両に統合することです。 Terranet の実際の中核は、イベントベースのイメージ センサー (イベント ベース カメラ センサー、またはイベント駆動型カメラ センサー) です。 イベント カメラは深度情報を提供できないため、LIDAR やステレオ システムを置き換えることはできません。そのため、完全な 3D 認識を実現するには、イベント カメラを LIDAR と組み合わせて使用する必要があります。 VoxelFlow テクノロジーは、非常に低い計算能力を使用して、極めて低い遅延で動的に移動するオブジェクトを分類できます。 1 秒あたり 1,000 万個の 3D ポイント クラウドを生成できるため、モーション ブラーのない高速エッジ検出が可能になります。イベントベース センサーの超低遅延パフォーマンスにより、車両は「ゴースト」問題にタイムリーに対応し、緊急ブレーキをかけたり、加速したり、車両の後ろに突然現れた物体を迂回したりして衝突事故を回避できます。 今日の AI は本質的に、膨大なデータと膨大な計算能力に依存する力ずくの計算です。データセットと計算能力に対する需要は絶えず増加しており、明らかに当初の意図からどんどん遠ざかっています。文明の進歩はすべて効率の大きな向上をもたらし、効率の向上だけが進歩です。膨大なデータと膨大な計算能力に依存する AI はまさにその逆で、効率が低下します。イベントカメラは正しい方向です。 |
>>: 人間の脳神経の「100万分の1」の3D接続マップを描きます!膨大な量のデータは14億個の1Tハードドライブを埋め尽くす
信じますか?近い将来に配達員が失業するなどとは信じられない人もいるかもしれないが、これは紛れもない事...
Google は最近、エンドツーエンドのニューラル オーディオ コーデックである SoundStre...
爆発的な人気を博している大規模モデルは、「汎用ロボットエージェント」に関する研究を再構築しています。...
「五十の大道あり、四十九は天から出たもの、人は一つを逃れる。」人々は未知のものに興味を持ち、その未知...
ITホーム 12月7日、Metaは新しい独立したAI画像ジェネレーター「Imagine with ...
こんにちは、教師向けに特別に設計された ChatGPT 教室チートの登場です! OpenAIの公式製...
AlphaGoとイ・セドルの人間対機械の戦い以来、人工知能はかつてないほどの注目を集め、大手企業が...
[[379936]]近年、人工知能、コンピュータービジョン、ビッグデータ、クラウドコンピューティング...
[[428794]]この記事はWeChatの公開アカウント「WeDoctor Front-end ...
機械学習への関心は過去 10 年間で爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエン...
ニシャ・アーヤ著翻訳者 | ブガッティレビュー | Chonglou生成 AI には現在どのような機...
Microsoft は、生成型人工知能ベースのデジタル アシスタント Copilot をより多くのソ...