アリババが自社開発したAI推論チップがリリース、Hanguang 800は他のチップより10倍強力

アリババが自社開発したAI推論チップがリリース、Hanguang 800は他のチップより10倍強力

[51CTO.comよりオリジナル記事] 9月25日、DAMOアカデミーの張建鋒学長は杭州雲奇カンファレンスでHanguang 800 AI推論チップのテープアウトを実演しました。業界標準のResNet-50テストでは、Hanguang 800は推論性能78,563 IPSを達成し、これは現在の業界最高のAIチップの4倍に相当します。エネルギー効率比は500 IPS/Wで、2位のチップの3.3倍です。「Hanguang 800は、アリババのチップ分野における長い行進の第一歩です。」

[[277873]] [[277874]]


Pingtou Geは昨年の雲旗カンファレンスで発表されて以来、過去1年間にXuantie 910とWujian SoCプラットフォームをリリースし、本日Hanguang 800チップをリリースしました。この一連の新製品の発売は、アリババのPingtou Ge製品ラインが形を整えたことを意味し、現在はプロセッサIP、ワンストップチップ設計プラットフォーム、AIチップをカバーし、チップ設計チェーンの完全なカバレッジを実現しています。

Hanguang 800とは何ですか?

Hanguang 800は推論に重点を置いたAIチップです。人工知能チップの差別化された設計は主にハードウェアアーキテクチャとソフトウェアアルゴリズムに反映されるため、チップの価値を最大化するには、この2つを高度に適応させる必要があります。現状から見ると、従来のCPUとGPUはディープラーニング推論タスクにおいてハードウェア能力を十分に活用できていません。たとえば、GPUアーキテクチャは主に画像処理用に設計されており、そのハードウェア構造とソフトウェアエコシステムはほぼ固定化されているため、AIタスクを深く最適化することは困難です。

パフォーマンスはどうですか?

Hanguang 800のチップアーキテクチャに関しては、革新的なアーキテクチャを採用しています。ディープラーニングで使用される大量の重みパラメータとテンソルデータに対して、スパース圧縮と量子化処理をサポートし、独自に設計されたデータアクセスとパイプライン処理技術を使用して、I/O要件とデータ移動を大幅に削減します。 NPU は畳み込み、行列乗算、ベクトル計算、およびさまざまな活性化関数も徹底的に最適化します。高効率のハードウェア リソース スケジューリングと完全に並列化されたデータ ストリーム処理により、AI コンピューティングのパフォーマンスとエネルギー効率を最高レベルに押し上げます。Hanguang 800 のパフォーマンスの飛躍的進歩は、ソフトウェアとハ​​ードウェアの共同イノベーションによるものです。

アルゴリズムの面では、アリババDAMOアカデミーのマシンインテリジェンス研究所は、過去2年間で音声インテリジェンス、言語技術、マシンビジョン、意思決定インテリジェンスなどの分野をカバーする完全なアルゴリズムシステムを構築し、多くの高レベルの成果を達成しました。ハードウェアの面では、アリババはサーバー、FPGA、ストレージの分野で長年の研究開発経験を持っています。さらに、Pingtou Ge技術チームは、アーキテクチャ、コンパイル技術などの分野で深い技術的蓄積を持っています。

1 つの Hanguang 800 チップ = 10 個の GPU


Hanguang 800のデータ性能は非常に優れています。現地の基調講演のデータによると、Hanguang 800 1個の性能はGPUの約10倍で、エネルギー効率比は500IPS/Wに達します。製造プロセスも12nmを採用し、トランジスタ数は170億個に達します。編集者は、同様のAIチップと比較した後、Pingtou GeのHanguang 800チップも業界で比較的リードしているという結論に達しました。

[[277875]]


漢光800理論性能データチャート

実際のパフォーマンス

Hanguang 800は現在、アリババのコアビジネスで使用されています。雲斉会議での現地デモンストレーションによると、杭州市主要都市の都市脳における交通ビデオのリアルタイム処理には、従来は300msのレイテンシを持つGPUが40個必要だったが、Hanguang 800を使用するとGPUが4個しか必要なくなり、レイテンシは150msに短縮された。また、皆さんがよく使っている Pailitao 製品が高速なのも、Hanguang 800 の性能のおかげです。Pailitao 製品ライブラリには毎日 10 億枚の製品画像が追加され、従来の GPU コンピューティング能力では認識に 1 時間かかりますが、Hanguang 800 では 5 分に短縮できます。

まとめ:
Hanguang 800の価格はまだ発表されていませんが、この高性能チップはコストパフォーマンスに優れた製品になると信じています。また、Pingtou Geによる一連のチップのリリースは、国産チップにとって大きな進歩を意味します。近い将来、より多くのコストパフォーマンスに優れた国産チップが登場することを期待しています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

[編集者:張斌 TEL: (010) 68476606]

<<:  2019 年のトップ 5 ディープラーニング コース

>>:  アリババ初のAIチップ「Pingtou Ge」が発売! NVIDIA P4 より 46 倍高速で、推論パフォーマンスの世界新記録を樹立

ブログ    

推薦する

「機械が人間に取って代わる」時代が到来。人類はこれからどう生き残っていくのか?

今年の春節祝賀会には、有名人よりも人気のある特別な俳優たちがいます。書道をしたり、ダンスをしたり、腕...

オープンソースの大規模モデルの王座が交代しました! Google Gemmaが市場に参入、ノートパソコンは動作可能でビジネスにも使用可能

ちょうど今、Google がオープンソースのビッグモデルに参入しました。オープンソースのビッグモデル...

食べられる「論理ゲート」:科学者たちはデザートを「ミニコンピューター」に変えた

過去 10 年間で、食品業界では 3D プリント食品、食用センサー、ロボット調理、AR ダイニングな...

Pythonアルゴリズム実践シリーズ: スタック

スタックは、特別な順序付けがされたテーブルです。挿入および削除操作はスタックの先頭で実行され、先入れ...

315 顔認識は安全性が疑問視されており、新たな潜在的な脅威となる可能性があるのでしょうか?

先週、「Facezam」と呼ばれる偽のアプリがFacebookの写真をスキャンして人々の顔を追跡でき...

...

...

人工知能と現代の香水の発展

嗅覚系は、感情と連合学習を司る脳の領域に直接つながっている、体内の唯一の感覚系です。これが、匂いがこ...

アルゴリズムのパフォーマンスを最適化するためにデータ品質を確保するための 6 つのヒント

今日、企業は、分析アルゴリズムの良し悪しは、そのアルゴリズムをトレーニングするデータの良し悪しによっ...

データ分析に人工知能を取り入れる方法

生成型 AI の台頭は、インターネットの誕生と同様の影響を及ぼしています。新しいテクノロジーが私たち...

AI応用分野トップ10: AIはかつてないほど優れている

1956 年のダートマス会議で AI が提案されて以来、AI 研究はいくつかの浮き沈みを経験してきま...

認知マップの科学的インベントリ: グローバルな第3世代AIの「大きな」機会

近年、人工知能 (AI) は、ディープラーニング、コンピューター ビジョン、自然言語処理などの技術革...

...

AIGCの投資刺激策のおかげで、マイクロソフトとグーグルのクラウドコンピューティング事業は大幅に成長した

MicrosoftとGoogleはAI市場の支配を競っており、両社ともAIハードウェアに多額の投資を...

IT リーダーが避けるべき 6 つの生成 AI の危険性

多くの場合、さまざまな組織がさまざまな方法で生成 AI テクノロジーを適用しますが、それがもたらす悪...