自動運転はエッジコンピューティングの重要な応用分野です。自動運転には100~1000TOPSのエッジAIコンピューティングパワーが必要です。高性能かつ低消費電力のエッジAI(エッジAI)は、業界の障壁となっています。 [[424830]] AI コンピューティングには、アルゴリズムとデータフロー アーキテクチャを最適化する領域が必要です。ムーアの法則は限界に達しています。適切なアルゴリズムとアーキテクチャがなければ、処理技術のみに基づいてパフォーマンスを向上させても、期待される結果は得られません。 エッジコンピューティング市場全体の規模は急速に拡大しています。画像出典: IDC 将来のコンピューティングプラットフォーム カテゴリー 1: フォン ノイマン AI アーキテクチャ - ハーバード大学は、パラメータ化されたディープラーニングベンチマークスイートであるParaDNNを発表しました。これは、さまざまなディープラーニングモデルを実行するさまざまなプラットフォームのパフォーマンスを比較できるだけでなく、モデル間の属性の相互作用、ハードウェア設計、ソフトウェアサポートの詳細な分析もサポートする、体系的かつ科学的なクロスプラットフォームベンチマークツールです。
- TPU (Tensor Processing Unit) は、Google が開発した、機械学習向けにカスタマイズされたプロセッサです。各操作を実行するために必要なトランジスタの数が少なくなり、効率が向上します。 TPU は、最高のトレーニング スループットを備え、CNN および DNN の大規模なデータ バッチに高度に最適化されています。
- GPU は TPU と同様のパフォーマンスを発揮しますが、小さなバッチや非 MatMul 計算などの不規則な計算に対してより優れた柔軟性とプログラミング性を備えています。
- CPU は RNN に対して最高の FLOPS 使用率を達成し、大きなメモリ容量により最大規模のモデルをサポートします。
[[424831]] カテゴリー2: 非フォン・ノイマン型AIアーキテクチャ - メモリ内コンピューティング (CIM): SRAM、NAND フラッシュ、および ReRAM、CeRAM、MRAM などの新しいメモリに基づく CIM アレイは、ニューラル ネットワーク コンピューティング用の再構成可能で再プログラム可能なアクセラレータとして考えられています。 CIM の利点: 高性能、高密度、低消費電力、低レイテンシ。現在の課題: ビット ライン アナログ信号検知を読み取るための ADC と専用の RAM 処理技術。
- ニューロモルフィック コンピューティング: ニューロモルフィック コンピューティングは、説明や自律的適応など、人間の認知に対応する領域に AI を拡張します。次世代の AI は、一般的な人間の活動を自動化するために、新しい状況や抽象化に対処できなければなりません。
- 量子コンピューティング: 量子コンピューティングでは、データの最小単位は磁場スピンに基づく量子ビットです。量子コンピューティングは量子もつれに基づいて 2 つ以上の状態を許可し、もつれの速度が非常に高速です (例: Google Sycamore、Quantum Supremay、53 Qbits、1.5 兆倍の速度、従来のコンピューターで 10,000 年かかるタスクを 200 秒で完了)。現在の課題: ノイズの多い中規模量子 (NISQ) コンピューターにおけるエラー率とデコヒーレンス。
- 量子ニューロモルフィック コンピューティング: 量子ニューロモルフィック コンピューティングは、脳のような量子ハードウェアにニューラル ネットワークを物理的に実装して、コンピューティングを高速化します。
[[424832]] エッジAIと垂直アプリケーション - エッジ AI は将来のコンピューティングを支配するでしょう。AI は将来の水平および垂直アプリケーションを可能にするテクノロジーです。
水平 AI アプリケーションは、さまざまな業界にまたがる幅広い問題 (コンピューター ビジョンや音声認識など) を解決します。一方、垂直 AI アプリケーションは、特定のドメイン (高解像度マップ、自動運転の測位やナビゲーションなど) 向けに高度に最適化された特定の業界向けです。 深いドメイン知識があれば、効率的な AI モデルとアルゴリズムによって計算速度を 10 ~ 100,000 倍に向上させることができます。これは人工知能の将来において最も中核的かつ重要な自動運転技術です。 - すべての垂直アプリケーション ソリューションには、複数のタスクに対応するマルチレベルの AI モデルが必要です。
[[424833]] AIモデルとアルゴリズム - DNN は人工知能の基盤であり、今日の DNN はバックプロパゲーションと呼ばれる学習形式を使用しています。今日の DNN はトレーニングに時間がかかり、トレーニング後は静的であり、実用的なアプリケーションに十分な柔軟性がない場合があります。
- 転移学習は、以前に開発された DNN を、DNN が 2 番目のタスクを学習するための開始点として「リサイクル」する方法です。転移学習を使用すると、DNN モデルはより少ないデータでトレーニングできます。
- 継続的(生涯)学習とは、以前の学習経験を保持しながら新しい知識を適応させることで継続的に学習する能力を指します。たとえば、環境と相互作用する自動運転では、独自の経験から学習する必要があり、長期間にわたって徐々に知識を獲得し、微調整し、転送できる必要があります。
- 強化継続学習 (RCL) は、慎重に設計された強化学習戦略を通じて、新しいタスクごとに最適なニューラル アーキテクチャを探します。 RCL メソッドは、壊滅的な忘却を防ぐのに優れたパフォーマンスを発揮するだけでなく、新しいタスクにもうまく適応できます。
自動運転システム (ADS) – 機能ブロック図。画像出典: ARM 自動運転技術にはブレークスルーが必要 - エッジの正確な位置決めとナビゲーション – 軽量で指紋ベースの正確な位置決めとナビゲーション。
- 重要なリアルタイム応答 – 人間の脳と同等の 20 ~ 30 ミリ秒
- 死角をなくす – V2X、V2I、DSRC、5G
- スケーラブル - 低消費電力、低コスト
画像出典: ARM 自動運転では、高解像度の地図、測位、環境認識において大量のデータを処理する必要があり、エッジで処理されるすべてのデータは重要な数ミリ秒以内に完了する必要があります。認識、位置決め、ナビゲーション、強化されたインタラクション(運転戦略)におけるインテリジェントで正確なデータ削減により、自動運転システムは遅延を減らし、変化する交通状況に迅速に対応できるようになります。 強力で高性能なエッジ人工知能 (エッジ AI) は、自動運転車の分野における主な障壁の 1 つです。 5G 接続は、信頼性の高い MIMO 接続、低遅延、高帯域幅をサポートします。 5G のサポートにより、強力なエッジ AI と高解像度の地図、測位、認識の革新が組み合わさり、真の自動運転が実現します。 |