AI Coreの「正体」を1つの記事で理解する

[[251095]]

2018年の初めから年末にかけて、携帯電話業界では人工知能がキーワードとなってきました。

携帯電話メーカーは、AI によって携帯電話がよりスマートになるという認識をユーザーに植え付けようと躍起になっており、スマート音声アシスタント、顔認証、インテリジェントな写真分類などの一連のアプリケーションをリリースしています。事実は、業界の動向が常に産業チェーンの上流に変化をもたらすことを証明しており、産業チェーンの頂点にある携帯電話チップも例外ではありません。

Apple A12とKirin 980はどちらも、携帯電話のAI処理能力を強化するためにNPUユニットを搭載していると主張しています。Qualcommは、Snapdragon 845のプロモーションに意図的に「人工知能」というラベルを付けました。Samsungが新たに発売したExynos 9820は、統合NPUユニットを備えた最初のExynosシリーズチップになりました。MediaTekは、Helio P70で「AI専用コア」のコンセプトを強調しました...

IC分野の専門家でなければ、NPUやAI専用コアなどの一連の概念を見て混乱するでしょう。AI専用コアとは一体何であり、どのような役割を果たすのでしょうか。これがまさにこの記事の本来の意図です。

AIチップとはいったい何でしょうか？

この質問に答える前に、まず 2 つの概念を理解しましょう。CPU と GPU とは何でしょうか?

簡単に言えば、CPU は携帯電話の「頭脳」であり、携帯電話の正常な動作の「司令官」です。 GPU はグラフィックプロセッサと翻訳され、その主な役割は画像処理です。

CPUとGPUの役割分担についてお話しましょう。CPUは「プログラムを格納して順次実行する」というノイマンアーキテクチャを基本としています。物事を系統立てて、ステップごとにこなす家政婦のようなものです。 CPU に木を植えるように指示すると、掘る、水をやる、植える、木を覆うという一連の作業を CPU が段階的に実行する必要があります。

GPU に木を植えるように指示すると、穴を掘る、水をやる、木を植える、土を覆うという作業を異なるサブタスクに分割して、Little A、Little B、Little C などを呼び出して共同でタスクを完了します。これは、GPU が並列コンピューティングを実行するためです。つまり、問題を複数の部分に分割し、各部分を独立したコンピューティングユニットで完了します。たまたま、画像処理ではすべてのピクセルを計算する必要があり、これは GPU の動作原理と一致しています。

Zhihu の専門家が例え話をしたように、CPU は積分、微分、その他あらゆる計算ができる老教授のようなものです。しかし、仕事によっては、100 以内の加算、減算、乗算、除算を大量に計算する必要があります。最善の方法は、老教授に 1 つ 1 つ計算させるのではなく、数十人の小学生を雇ってタスクを分散させることです。これはCPUとGPUの役割分担です。CPUは大規模な計算を担当し、GPUは画像処理用に設計されています。これはパソコンからスマートフォンまですべてに当てはまります。

しかし、人工知能の需要が出てくると、CPUとGPUの分業に問題が生じてきました。人工知能端末のディープラーニングは、従来のコンピューティングとは異なります。その背景は、事前に大量のトレーニングデータからルールをまとめ、人工知能端末が判断に使用できるパラメータを取得することです。例えば、トレーニングサンプルが顔画像データであれば、端末に実装される機能は顔認識です。

CPU はニューロンの処理を完了するために数百、あるいは数千もの命令を必要とすることが多く、大規模な並列コンピューティングをサポートできません。一方、携帯電話の GPU はさまざまなアプリケーションの画像処理ニーズに対応する必要があります。 CPU と GPU に人工知能タスクを強制的に実行させると、通常は効率が低下し、大量の熱が発生します。

これには、Qualcomm と MediaTek が解決策を考え出す必要があります。残念ながら、主要なモバイルチップメーカーが提案する解決策は多少異なります。

Qualcommの現在の商用主力プロセッサは、Adreno 630 GPUを搭載したSnapdragon 845です。前世代のSnapdragon 835と比較して、AI処理能力が3倍に向上し、複数のプラットフォームでニューラルネットワークシステムをサポートしています。おそらく GPU のパフォーマンスに自信があったためか、あるいは AI 需要の到来に気付いていなかったためか、Qualcomm は独立した AI コンピューティングユニットを持たず、依然として CPU、GPU、DSP などに依存して AI のニーズをパートタイムで処理しています。

MediaTek は常に過小評価されてきたプレーヤーです。同社が提供するソリューションは、Google の TPU に似ています。ASIC (特定用途向け集積回路) を使用して、人工知能のニーズに対応するために特別に設計された AI コアを作成し、Helio P60 や Helio P70 などのチップに統合された小さな IP になっています。 AIコアの利点は、実行速度が速く、消費電力が低いことです。CPUとGPUと連携して動作できます。CPUは大規模なコンピューティングを担当し、GPUは画像処理を担当し、AIコアはディープラーニングに関連するシナリオを担当します。

記事の冒頭で触れたNPUは、中国語ではニューラルネットワークプロセッサと翻訳されており、Apple A12、Kirin 980、Exynos 9820が提供するソリューションです。実際にはAI専用コアの一種です。簡単に言えば、人工知能アクセラレータです。GPU はブロックデータ処理に基づいていますが、携帯電話の AI アプリケーションはリアルタイム処理を必要とするため、人工知能アクセラレータはまさにこの問題を解決し、ディープラーニング関連の作業を引き継ぐことで、CPU と GPU への負担を軽減します。

Apple A12、Kirin 980、Exynos 9820のNPUユニットとAI専用コアは、CPUとGPUの計算ワークロードを分離し、顔認識や音声認識などのAI関連のタスクをASICにオフロードして処理するという同様の原理を持っていることがわかります。AI専用コアは長い間業界のトレンドになっています。

しかし、「NPU」の概念はまだ完全に統一されていません。一部のプレーヤーは依然として複数のDSPコアを統合することでリソースサポートを動員しています。CambrianのIPはMobilenetv1 / v2の処理にいくつかの問題を抱えています。そのため、MediaTekはこの点でより大きな一歩を踏み出す必要があることが強調されています。

AIは画期的な発明か、それとも幻想か?

AIシナリオを処理するために「専用コア」を使用することには、機能が単一であること、開発期間が長いこと、チップコストが増加すること、携帯電話内でのスペースの占有など、欠点がないわけではありません。おそらくこれが、Qualcommがこのソリューションを選択しなかった理由です。

しかし、AI専用コアが飛躍的な進歩なのか、それとも無駄な空想なのかを判断するには、実際の使用シナリオをいくつか比較するだけで十分です。

最も広く使用されているAI顔認識を例にとると、これは「スキャンと検出」と「結果の判断」のプロセスです。スキャンプロセス中に顔の特徴の座標配置、顔属性認識、顔の特徴抽出などを判断し、その後、判断を行う際に顔の特徴、顔認識、生体認証などに基づいて比較する必要があります。顔認識は純粋にアルゴリズムの問題ではなく、CPU、GPU、VPU、DLA などの複数のコンピューティングユニットも関与します。

一部のメディアは、MediaTek Helio P60、Qualcomm Snapdragon 845、Snapdragon 710を搭載したスマートフォンで顔認識を行う比較テストを実施しました。前者はAI専用コアを搭載し、後者2つはソフトウェア最適化ソリューションを使用しました。最終的な顔認識速度はそれぞれ316.5ms、687.5ms、950msでした。どちらもミッドレンジプロセッサとして位置付けられていますが、MediaTek Helio P60の顔認識速度はSnapdragon 710を圧倒し、Snapdragon 845の半分近くの時間を節約します。AI専用コアの利点は明らかです。

なぜこれほど大きな差があるのでしょうか。顔認識のプロセスでは、まずカメラが、光が薄暗いか顔が向こうを向いているかに関係なく顔を識別し、次に目の大きさや顔の長さなどの顔の特徴を正確に判断し、既知のサンプルと比較して、その人物が誰であるかを判断する必要があります。プロセス全体には、極めて高いコンピューティング能力のサポートが必要です。専用の AI コアを備えた Helio P60 は、当然のことながら、フラッグシップの Snapdragon 845 など、CPU と GPU の処理をパートタイムで行うチップよりも効率的です。

AI専用コアの甘さを味わった後、MediaTekはHelio P70でAI専用コアのアップグレードを続けました。AI処理能力は前世代と比較して30％向上し、人間の姿勢認識、AIビデオエンコーディング、リアルタイム写真美化、シーン検出、AR機能など、より複雑なAIアプリケーションをサポートします。

例えば、美容ブロガーがライブ配信をしているとき、Helio P70（MediaTekのAIコアの名称）の1つのAPUで顔検出とリアルタイム美化を行い、もう1つのAPUでHDR処理と背景ぼかしを同時に行うことができます。 Snapdragon 845 ソリューションの場合、顔検出、画像分割、背景ぼかし、HDR 処理、マルチフレーム合成などの処理を 1 つの DSP で完了する必要があり、速度の違いはここから生じます。

たとえば、写真撮影の場合、高ダイナミックレンジの HDR 画像を作成するには、3 枚の 12 ビット RAW 写真を合成し、ISP を使用して最適化された写真を出力する必要があります。写真を撮影してから出力するまでの時間は非常に短いため、多くの計算能力が必要となり、2～3秒の遅延が発生することがよくあります。しかし、Helio P70のデュアルコアAPUは、デュアルスレッドを並行して加速し、写真の最適化を1秒未満で完了できるため、単一のDSPの処理よりも効率的です。

メディアテックだけでなく、ファーウェイもKirin 980発表会で、主に画像とビデオ処理に反映されるAIにおけるデュアルコアNPUの利点を実証するために全力を尽くしました。例えば、物体認識では、輪郭の認識から細部の認識へと進み、リアルタイム物体セグメンテーションでは、過去のやや大まかなシーン分割から現在は細かい分割へと進んでいます。同時に、Kirin 980 は複数のオブジェクトのリアルタイム「追跡」も可能にし、1 分間に最大 4,500 枚の画像を認識し、ビデオの「背景の変更」もサポートします。

さらに、AI コアのもう 1 つの大きな利点は、おそらくバッテリー寿命です。少なくとも Apple、Huawei、MediaTek はそれを証明することに熱心で、次の 2 つの側面に焦点を当てています。

一方、AIコアの価値はCPUとGPUとの協調的な分業にあります。CPUとGPUにタスクを積み重ねすぎると、電力が浪費され、温度が上昇するだけです。たとえば、Snapdragon 845のパフォーマンスは非常に強力ですが、AI写真を撮るとまだ少し発熱します。Helio P70などのAIコアを搭載した製品では、この問題はありません。

一方、AI コアの連携により、ユーザーの行動を学習し、ユーザーの使用シナリオを予測して、適切なパフォーマンスの割り当てを行うことができます。たとえば、ゲームをプレイしているときに CPU が効率的に動作し、電子書籍を読んでいるときにパフォーマンスの無駄を回避できます。

最後に

私たちの実生活を考えると、過去2年間の画像処理のニーズは美容に限られていました。現在、短いビデオやライブブロードキャストでは、携帯電話のAIパフォーマンスに対する要求が高まっています。MediaTekのAIコアは、この目的のために生まれました。

結論として、MediaTek、Huawei などは、AI 専用コアや同様のコンセプトを通じてチップの AI 機能を向上させることで、モバイルチップの将来の方向性に間違いなく正しい賭けをしたと言えます。おそらく 2、3 年後には、AI 専用コアは携帯電話チップに欠かせないコンポーネントになるでしょう。これらのチップ大手が AI 専用コアで競争を続け、革新し、ブレークスルーを達成していくことも期待しています。

<<: AIテクノロジーが業界のアップグレードを促進 WOT2018グローバル人工知能テクノロジーサミットがインテリジェントな未来を推進

>>: 中国移動のチーフサイエンティスト、馮俊蘭氏との独占インタビュー：AIビジネスアプリケーションは何度も融合する必要がある