2019 年 2 月、チューリング賞受賞者のジョン L. ヘネシー氏とデビッド A. パターソン氏は、次の 10 年間がコンピューター アーキテクチャの分野における「新たな黄金の 10 年」になると予測する長いレポートを発表しました。今年は、アーキテクチャの革新とチップレットがさらに注目を集めました。新興企業から巨大企業まで、端末からクラウドまで、AIチップが次々と発売されました。 AIチップ市場での競争は激化しているが、その多くは実装に困難に直面している。 2019年のAIチップの発展を振り返ると、6つのキーワードが流れています。 2020年のAIチップ市場を展望すると、4つの大きなトレンドを無視することはできません。
6つのキーワードキーワード1:建築イノベーション チューリング賞受賞者のジョン・L・ヘネシー氏とデビッド・A・パターソン氏は報告書の中で、「コンピュータアーキテクチャの分野は、1980年代に研究を行ったときと同じように、新たな黄金の10年を迎えることになるだろう。新しいアーキテクチャ設計は、コストの低減、エネルギー消費の改善、セキュリティとパフォーマンスの向上をもたらすだろう」と述べた。 2019年、Leifeng.comはインテルの上級副社長、チーフアーキテクト、アーキテクチャ、グラフィックス、ソフトウェア担当ゼネラルマネージャーであるラジャ・M・コドゥリ氏にインタビューし、チューリング賞受賞者2人の見解に同意するかどうかを尋ねました。同氏は「次の10年がコンピューティング アーキテクチャにとって新たな黄金の10年になるだろうということに完全に同意します。次の10年間で、過去50年間よりもはるかに多くのアーキテクチャの最適化と改善が見られるでしょう」と語り、「ソフトウェアとハードウェアを組み合わせることで、ムーアの法則の改善を10倍に高めることができます」とも述べた。 AI チップにとって、アーキテクチャ革新の重要な価値の 1 つは、メモリ ウォールの課題を解決することです。 AI チップ企業は私たちをあまり長く待たせませんでした。2019 年 5 月、Kneron は革新的なアーキテクチャを備えた IoT 専用の AI SoC をリリースしました。Kneron はこれを再構成可能なアーキテクチャと呼び、チップをビルディング ブロックのように組み合わせて音声と視覚の両方のニーズに対応できるようにしました。 1 か月後、革新的なアーキテクチャを備えた AI 音声チップがさらに 2 つ発売されました。 1つはTanjing Technologyの製品です。CEOのLu Yong氏は、同社の革新的なSFAはストレージスケジューリングを中核とするコンピューティングアーキテクチャであると述べました。計算はストレージ間のデータ移動の過程で完了します。コンピューティングはデータの進化に過ぎません。このアーキテクチャは、より高いエネルギー効率を実現できるだけでなく、あらゆるニューラル ネットワークをサポートし、クラウド チップや端末チップに適しています。 もう 1 つは Qingwei Intelligence のもので、ソフトウェアとハードウェアの両方をプログラム可能にし、粒度が混在し、チップのハードウェア機能がソフトウェアの変更に応じて変化し、アプリケーションがソフトウェアを変更し、それによってハードウェアの特性が変化する再構成可能なアーキテクチャ (CGRA) を使用しています。 Qingwei Intelligence の創設者兼 CEO である Wang Bo 氏は、CGRA の最大の利点は 2 つの側面に表れていると述べています。1 つ目は、従来の命令駆動型コンピューティング アーキテクチャの命令フェッチとデコード操作に伴う遅延とエネルギー消費のオーバーヘッドがないことです。2 つ目は、コンピューティング プロセス中に「専用回路」に近い方法で実行されることです。 CPU や GPU と比較すると、パフォーマンスの向上は 10 倍から 1,000 倍に及びます。 11月、英国のAIチップユニコーン企業Graphcoreの共同創業者兼CEOであるナイジェル・トゥーン氏は、Leifeng.comとのインタビューで、Graphcoreは新しいタイプのプロセッサであるIPUを開発したと語った。これは機械知能向けに特別に設計されたプロセッサであり、効率的で使いやすいプロセッサに対する人々のニーズを満たすことができる。 IPU サーフェスには 1216 個のコアがあり、これをタイルと呼びます。各タイルにはコンピューティング ユニットとメモリがあります。数千のプロセッサが動作することで、単一の IPU のストレージ帯域幅は 45TB に達します。これは、最も高速なパフォーマンスを誇る HBM の 50 倍以上です。同じコンピューティング能力で、消費電力は半分に削減されます。 同月、智村科技はインメモリコンピューティングチップをリリースしました。同社のチップは、保存と計算の両方が可能なFLASHの特性を活用しています。ストレージアレイを変更し、周辺回路を再設計することで、回路はより多くのデータを収容し、AIアルゴリズムのニーズを満たすことができます。同時に、NOR-FLASHがより成熟しており、商用利用が容易であるという事実を活かし、ストレージとコンピューティングを統合したAI音声チップを発売しました。 AI チップのアーキテクチャ革新では、再構成可能なアーキテクチャと統合ストレージおよびコンピューティングが現在注目を集めています。 キーワード2: 専用チップ AI チップ アーキテクチャの革新の目標は、AI アルゴリズムの継続的な進化に適応しながらチップの高いエネルギー効率を維持することですが、2019 年に発売された新しい AI チップのほとんどは、依然として専用のアクセラレータです。 2018 年のインタビューで、Arm ML ビジネス グループのビジネスおよびマーケティング担当副社長である Dennis Laudick 氏は、GPU と FPGA は最終的には消滅し、最も一般的な CPU と最も特化した NPU だけが残るだろうと考えていました。 2019年も彼はこの見解を維持し、将来の市場に必要なのは、より幅広い用途に対応する汎用チップと専用チップであると信じていました。 Leifeng.com は、さまざまなインタビュー対象者にこの質問に対する回答を求めました。彼らの見解はそれぞれの立場によって異なりましたが、ほとんどの人は AI が成熟するにつれて AI チップが普及すると信じていました。 この判断は理解しやすい。産業分野にとって、チップを発売する最も重要な価値は、商業的価値を得ることにある。AIアルゴリズムが急速に反復される中で、特定のプログラミング機能のみを持ち、一部のアルゴリズムのみを対象とし、既存のソリューションよりも10倍以上の改善があるAIチップの方が、ユーザーに採用される可能性が高くなる。 このロジックは、携帯電話のNPUによってもうまく説明できます。携帯電話のSoCにNPUを追加した最初の企業は、HuaweiとAppleです。この2社の携帯電話は、自社開発のSoCを使用しています。NPUを最初に追加することで、自社の携帯電話のAI機能が他の携帯電話よりも優れていることを実証し、これをセールスポイントとして活用することができます。 対照的に、QualcommとMediaTekは、2大携帯電話SoCプロバイダーとして、AIアルゴリズムがまだ未熟で多くの顧客に直面しているときには、より汎用的なプロセッサを使用し、アルゴリズムとアプリケーションが比較的明確であるが、より高いAIパフォーマンスとより優れた柔軟性を維持する必要がある場合には、NPUを統合する傾向があります。 キーワード3: チップレット Chiple は、小さなチップまたはコア粒子と翻訳できます。2019 年の Chiplet コンセプトの人気の原動力には、DARPA の CHIPS プロジェクト、Intel の Foveros、AMD の新世代 EPYC プロセッサなどがあります。簡単に言えば、チップレット技術はビルディングブロックのようなものです。特定の機能を備えたいくつかの事前に製造されたチップダイが、高度な統合技術(3D統合など)を通じてパッケージ化され、システムチップを形成します。基本的なダイがチップレットです。 つまり、Chiplet は新しい IP 再利用モデルです。従来、チップ設計会社は、IP サプライヤーからいくつかの IP (ソフト コア (コード) またはハード コア (レイアウト)) を購入し、自社開発のモジュールと組み合わせて SoC を統合し、特定の半導体プロセスを使用してチップの設計と製造の全プロセスを完了していました。 将来的には、チップレットモデルでは、他社が設計したシリコンウェハーを購入するだけで済み、先進的なパッケージング技術によって統合できるチップは「スーパー」異種システムとなり、AIコンピューティングにさらなる柔軟性と新たな機会をもたらすことができます。 ある意味、Chiplet は 2018 年に盛んに議論されたヘテロジニアス コンピューティングのさらなる発展形です。 SoC は異種システムです。AI ではチップに対する要求が高くなるため、異種性は広く議論されています。汎用および専用の異種システムは、AI のニーズをよりよく満たすことができます。 Chiplet の導入により、プロセスの選択、アーキテクチャ設計、ビジネス モデルに柔軟性がもたらされ、AI チップの異種混合性を実現しやすくなります。課題も明らかです。パッケージング技術が高度化しているだけでなく、基準や品質もまだ不明確で、プログラミングの複雑さも大幅に増大しています。 キーワード4: ソフトとハードの統合 異種システムのプログラミングの複雑さを軽減するために、ソフトウェア プラットフォームの重要性がさらに高まります。このとき、新しいソフトウェア プラットフォームや、新しいプログラミング言語が必要になる場合があります。Intel は、プログラミングの複雑さの課題を解決するために oneAPI を使用し、標準ベースのクロスアーキテクチャ言語である Data Parallel C++++ (DPC++) も採用しています。 oneAPI の重要性は、スカラー プロセッサ (CPU)、ベクター プロセッサ (GPU)、マトリックス プロセッサ (AI アクセラレータ)、空間プロセッサ (FPGA) など、SVM と略されることが多いさまざまなコンピューティング アーキテクチャにわたるアプリケーション開発を簡素化するための統一されたプログラミング モデルを提供することです。 DPC++ は C++ をベースとし、Kronos Group の SYCL プログラミング言語を組み込んでおり、データ並列処理と異種プログラミングをサポートし、オープン コミュニティ プロセスで開発された言語拡張機能が含まれています。特定のアクセラレータのカスタム デバッグと、単一のアーキテクチャを置き換える独自の言語のための業界横断的なオープン ソリューションです。 Intel のソリューションは、より高度なアプローチです。 Arm や多くの IP プロバイダーは、まったく新しいプログラミング言語を必要としない、より低レベルのアプローチを採用しています。ソフトウェア プラットフォームを通じて CPU、GPU、または NPU と直接通信し、タスクに基づいて最適な組み合わせを実現し、異種性によって生じるプログラミングの課題を解決します。 しかし、どちらにしても、最適なマッチングを実現するのは非常に困難です。 異種混在がより重要になる AI 時代においては、ソフトウェアとハードウェアのより優れた統合が不可欠であり、業界も AI におけるソフトウェアとハードウェアの統合の価値をより認識するようになりました。中国コンピュータ連合会(CCF)が主催し、Leiphone.comと香港中文大学(深圳)が共催し、深圳人工知能ロボット研究所が共催した第4回グローバル人工知能およびロボットサミット2019(CCF-GAIR 2019)のAIチップ特別セッションで、大物たちがソフトウェアとハードウェアの統合について言及した。 インテルのデータセンター技術営業部門のチーフエンジニア兼人工知能担当チーフテクニカルアーキテクトである夏磊氏は、AIコンピューティングにはハードウェアとソフトウェアの組み合わせが必要だと提唱した。 Shencong IntelligenceのCTOであるZhu Chengyu氏は、ソフトウェアとハードウェアの統合によりエッジコンピューティングが可能になると述べた。 Chujing Infinity Technologyの共同創設者兼CEOであるXiao Hongbo氏は、スマートシティの課題を解決するには、ハードウェアとソフトウェアを統合した使いやすい認識チップが必要だと語った。天樹知新の創業者、会長兼CEOの李雲鵬氏は、大量データ時代においてはソフトウェアとハードウェアの完全な統合が特に重要であると考えています。 中国科学院計算技術研究所の研究員、先端コンピュータシステム研究センター所長、中国オープンインストラクションエコシステムアライアンス事務局長のバオ・ユンガン氏は、ソフトウェアとハードウェアのパフォーマンスには大きな差があると述べた。同じアルゴリズムやプログラムでも、普通のプログラマーとシステムアーキテクチャを理解しているプログラマーでは、パフォーマンスが63,000倍も異なる場合がある。ムーアの法則に当てはめると、ムーアの法則をさらに 20 年延長することになります。実際、ムーアの法則は大きな可能性をもたらしましたが、その可能性はまだ十分に活用されていません。 キーワード5: 効果的な計算能力 ハードウェアとソフトウェアの統合は、AI チップの効率的な計算能力の向上も意味します。実効コンピューティング能力が注目され始めた理由は、AI チップの実装により、AI チップのピークレートが非常に高くても、実効コンピューティング能力が非常に低く、期待されるパフォーマンスの向上をもたらさないことがユーザーに認識されたためです。 天樹志信の CEO である Li Yunpeng 氏は、このことを非常に早い段階で認識していたため、ソフトウェアとハードウェアを使用して、平均コンピューティング能力だけでなく、ピークコンピューティング能力も向上させるというアプローチを採用しました。雲天利の陳寧CEOは昨年11月に行われた記者会見で、人工知能は現在まだ初期段階にあり、汎用AIチップどころか汎用人工知能の時代に入っていないため、効果的なシナリオ指向のコンピューティングパワーをより重視していると強調した。有効なコンピューティング能力 = コンピューティング能力 x 効率 x AI パフォーマンス。これは、チップ、ツール チェーン、アルゴリズム アプリケーションに対応します。 Horizon はまた、単位コストでのピークコンピューティング能力 x コンパイラ、アーキテクチャ、ランタイムの最適化 x シナリオ適応型アルゴリズムの最適化と進化 = AI チップの実際のパフォーマンスの包括的な最適化を提案しました。 Horizon Roboticsの副社長兼スマートIoTチップソリューション製品ラインのゼネラルマネージャーである張勇謙氏は、Leiphone.comが主催したグローバルAIoT業界スマート製造サミットでのスピーチで、従来のチップは基本的にPPA(電力、性能、面積(コスト))について語っているが、AIエッジコンピューティングになると、この評価は非常に複雑になると述べた。コンピューティングパワーだけでは十分ではなく、コンピューティングパワーの有効活用も必要となる。シーン処理の出力結果の有効性指標は、AIチップ全体(アルゴリズムを含む)を測定するための最も重要な指標です。 クラウドAIチップを専門とするスタートアップ企業Enflameは、端末に加え、効率的なコンピューティング能力も重視している。EnflameのCEOであるZhao Lidong氏は、「独占市場では、すべての顧客が交渉力を持つために新しい選択肢を求めており、市場にはそのような痛みがあります。さらに、彼らはまた、より高い費用対効果とエネルギー効率、特に着陸シーンで達成できる効果的なパフォーマンスを望んでいます」と語った。 キーワード6: オープンソース 2019年のもう一つのキーワードはオープンソースであり、その最大の原動力はRISC-Vです。 RISC-V はオープンソースの命令セットです。この命令セットに基づく IP、チップ、製品は 2020 年に市場に投入される予定です。もちろん、RISC-V AIチップも多く存在し、AIチップ市場に新たな競争力をもたらすだけでなく、x86とArmがチップ市場を独占するという既存のパターンを打破する可能性もある。 OURSとGreenWavesはともにRISC-VベースのエッジAIチップを発売している。Huami初の自社開発AIチップであるHuangshan No. 1もRSCI-V命令セットをベースとしており、同社のスマートウォッチに使用されている。 RISC-V が急速に発展していた 2019 年に、Arm は、顧客が特定の CPU コアにカスタム命令機能を追加して、特定のユースケース、組み込みアプリケーション、IoT アプリケーションを高速化できる新しい機能、Arm カスタム命令を発表しました。 オープンソースとAIは、Armの数年後に設立されたMIPSがオープンソースを発表するきっかけにもなりました。Wave ComputingのCEOであるアート・スウィフト氏は、AIとIoTの新時代にMIPSが新たな機会をもたらし、この新たな機会に直面して、誰もが同じスタートラインからスタートすると考えています。さらに、MIPS の技術的利点は AI との統合に非常に適しています。 残念ながら、2019 年 11 月、MIPS を所有する Wave Computing は、2019 年 11 月 14 日以降、アーキテクチャ、コア、ツール、IDE、シミュレータ、FPGA パッケージ、または関連するソフトウェア コードやコンピューター ハードウェアを含む MIPS オープン ソース コンポーネントの無料ダウンロードを提供しなくなると発表しました。 オープンソース分野にも新たな勢力が生まれています。平頭閣はオープンソースのMCUチップ設計プラットフォームを発表しました。ターゲットグループには、チップ開発者、IPサプライヤー、大学、研究機関が含まれます。開発者はこのプラットフォームに基づいてニッチ分野向けのカスタムチップを設計でき、IPサプライヤーはプラットフォーム固有のコアIPを開発でき、大学や研究機関はチップ関連の教育や科学研究活動を行うことができます。
4つの大きなトレンドトレンド1:AI音声チップの競争が激化 AI応用の2つの主要な方向は、視覚と音声です。音声は視覚に比べて技術的な課題が少ないだけでなく、出荷量が非常に多いスマートスピーカー製品もすでに存在します。 AI競争が激化する中、アルゴリズムに強い企業は優位性を保つために、AISpeechなどの自社開発のAIチップを発売している。 アルゴリズム企業のほか、革新的なアーキテクチャを備えたAIチップを持つTanjing Technology、Zhicun Technology、Qingwei Intelligenceも2019年に音声チップをリリースした。その中で、Tanjing Technologyはすでに30社のパートナーを抱えており、同社のAI音声ソリューションの出荷数は数百万に達している。Qingwei IntelligenceのAI音声チップも量産され、収益を上げている。Zhicun Technologyにも多くの潜在顧客がいる。 AIスマートスピーカー向けチップを提供する従来のチップ企業と相まって、AI音声チップの競争はさらに激しくなるだろう。もちろん、この競争は市場の需要の増加を伴います。今後数年間で、スマートホーム市場におけるAI音声チップの需要も急速に増加すると予想されます。 トレンド2: クラウドチップ市場における競争 NvidiaとIntelはAIクラウドチップ市場の利益を最初に享受し、クラウドAIトレーニング市場におけるNvidiaの地位は他の追随を許さないものでした。しかし、インテルによるNervana NNP-TとNervana NNP-Iの発売、Habana Labsの20億ドルでの買収、そして今年半ばに予定されている独立GPU Xeの発売により、クラウドAIチップ市場におけるNvidiaとインテルの競争はより激しくなるだろう。 同時に、Cambrian、Bitmain、Suiyuan Technologyなどの国内企業も2019年にクラウドAIチップを発売し、一定の市場シェアを獲得することを目指してニッチ市場からクラウドAIチップ市場に参入しました。 2020年には、大手企業や新興企業による製品の発売により、クラウドAIチップ市場での競争が徐々に激化し、Nvidiaの発言力がある程度弱まる可能性があります。 トレンド3: エンドクラウドエコシステムの戦いが正式に始まった 従来のチップであれ、AI チップであれ、チップの成功の本質はエコシステムの成功です。そのため、巨大チップ企業であろうとスタートアップ企業であろうと、彼らは皆、エンドクラウド統合戦略を持っています。エンドクラウド統合戦略を通じて強力なエコシステムを構築し、広い堀を作り、会社の業績の継続的な成長を維持したいと考えています。違いは、実装の難しさにあります。 2019年、クラウドAIチップ市場で大きな成功を収めたNVIDIAとGoogleは、エッジ向けAIチップを相次いで発売したり、エッジAIチップの機能を強化したりした。 Intel は、AI の課題に対応するために包括的な AI チップを開発しました。 この観点から見ると、有力企業によるエンドクラウド統合AIチップ戦略の立ち上げと実行により、2020年のエッジAIチップ新興企業はより大きな生存圧力に直面することになるだろう。 トレンド4: 使いやすさがより重要になる 音声から画像、エッジからクラウドまで、実装のスピードが、ますます激化する競争で足場を築く鍵となります。実際、2019年にはすでに多くの商用AIチップが存在していますが、大手企業であれ新興企業であれ、多くの企業がチップの実装が難しいという問題に直面しています。チップ自体がもたらすパフォーマンスの向上が魅力的ではない、チップがアプリケーションの要件に適していない、ユーザビリティが高くない、選択した業界を突破するのが難しいなど、理由はさまざまです。 そのため、2020 年にはチップの使いやすさがさらに重要になります。これにより、技術的に顧客トライアルのコストが削減され、製品を市場に投入するまでの時間が短縮され、ハードウェアの反復速度が遅いためにアプリケーションのニーズを十分に満たせないという問題点が補われます。 |
<<: どこにでもAI?小売業における 10 のエキサイティングな AI アプリケーション
>>: 中国をターゲットに!米国はドローンや衛星画像を含むAIソフトウェアの輸出を緊急制限
[[261735]] [51CTO.com クイック翻訳] アイリーン・リーはカウボーイ・ベンチャー...
Amazon の Echo および Echo Dot スマート スピーカーの成功により、音声コマンド...
最近、「両会」の政府活動報告では、人工知能が再び言及された。「新世代人工知能の研究開発と応用を強化し...
IDCはこのほど、2019年および今後10年間の中国の情報通信分野と技術応用に関するトップ10予測を...
動画の途切れや解像度の低さは視聴者の視聴体験を著しく低下させ、広告主の利益にも悪影響を及ぼします。現...
一貫性のあるハッシュについて見てきましたが、一貫性のないハッシュもあるはずです。私たちが普段話題にし...
現在、ディープラーニングはデータサイエンスの分野で最も人気のあるスキルとなっています。ディープラーニ...
皆さんこんにちは、ルガです。今日も引き続き、人工知能 (AI) エコシステムに関連するテクノロジーで...
高速でメモリ効率に優れたアテンション アルゴリズム、FlashAttention がここにあります。...
序文これは Zhihu に関する質問です: k 近傍法、ベイズ法、決定木、SVM、ロジスティック回帰...
ショートビデオの推奨やソーシャル推奨などのアプリケーションシナリオでは、推奨システムは大量の急速に変...
ある夜、目が覚めると、大手モデルサークルが「GPU-Poor」という言葉について熱く議論しているのに...