7nmプロセス限界を突破した世界初の3DウェーハレベルパッケージングプロセッサIPUがリリース

7nmプロセス限界を突破した世界初の3DウェーハレベルパッケージングプロセッサIPUがリリース

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

英国を拠点とするAIチップ企業Graphcoreは、次世代IPU製品である第3世代IPUシステム「Bow」をリリースしました。リリース後すぐに顧客に出荷されます。前世代の IPU と比較すると、Bow IPU はパフォーマンスが 40% 向上し、エネルギー効率が 16% 向上し、電力効率が 16% 向上しています。

注目すべきは、今回のBow IPUの性能向上は、より先進的なプロセスの使用に主に依存しているわけではないということだ。Bow IPUは前世代のIPUと同じTSMC 7nmを使用し、TSMCと共同開発した先進的なシリコンウェーハスタッキング技術(3D Wafer-on-Wafer)を採用することで、性能とエネルギー効率の向上を実現している。

世界初の 3D WoW プロセッサである Bow は、チップ性能向上のパラダイムを高度なプロセスから高度なパッケージングへと移行できる可能性を証明しています。

新世代IPUは、価格はそのままで、パフォーマンスが40%向上しています。

2016 年に Graphcore が設立され、新しいタイプのプロセッサ アーキテクチャである IPU を開発しました。そのアーキテクチャの革新は、かつて英国の半導体の父であるヘルマン ハウザーによってコンピューター史上の第三の革命と呼ばれました。

Graphcore の IPU は、6 年間の開発を経て、金融、医療、通信、ロボット工学、クラウド、インターネットなどの分野で徐々に成果を上げてきました。今週の木曜日、Graphcore は第 3 世代製品である Bow IPU を発売しました。

Graphcoreによれば、第3世代IPUは前世代のM2000と比較してパフォーマンスが40%向上し、ワットあたりのパフォーマンスが16%向上しており、エネルギー効率比が16%向上しているという。しかし、AI チップの真のパフォーマンスについては、さまざまな応用分野でまだ議論する必要があります。このため、Graphcore はさまざまな垂直分野での Bow のパフォーマンスも提供します。

画像に関して言えば、一般的なCNNネットワークでも、最近人気のVision Transformerネットワークでも、ディープテキスト・イメージネットワークでも、Bow IPUは前世代の製品に比べて30%~40%の性能向上を実現しており、EfficientNet-B4の項目では理論上の上限に近づいています。

BERT トレーニング モデルは、自然言語の古典的なモデルです。OpenAI は、BERT に基づいて、GPT-1、GPT-2、GPT-3 などの垂直または水平拡張を提案し、ネットワーク レイヤーの深化とネットワーク幅の拡大により、モデルのパフォーマンスと精度をさらに向上させました。

「これらのモデルは、当社の最新のハードウェアフォームファクターで大幅なパフォーマンス向上を実現していることがわかります」と、Graphcoreの中国エンジニアリング担当副社長兼AIアルゴリズム科学者のJin Chen氏は述べています。

それだけでなく、実際のモデルのスループットに換算すると、IPU POD64と比較すると、Bow Pod64のスループットは、コンピュータービジョンのResNet50とEifficientNet-B4のトレーニングモデルでそれぞれ34%と39%のパフォーマンス向上を達成できます。自然言語に関しては、BERT-Large Ph1 事前トレーニング済みモデルと音声認識 Conformer Large トレーニング モデルの両方でスループットが 36% 向上しました。

Nvidia の競合企業として、Graphcore は当然のことながら Bow Pod16 と DGX-A100 の比較を忘れませんでした。実験データによると、EfficientNet-B4 バックボーンのトレーニングには DGX-A100 では 70 時間のトレーニング時間が必要ですが、Bow Pod16 では約 14 時間しかかかりません。

Graphcore Bow IPU はどのようにして理論限界に近いパフォーマンスの向上を実現するのでしょうか?

5nmはもはや第一選択肢ではなく、高度なパッケージングの方がコスト効率が高い

チップの仕様から判断すると、Bow IPUはTSMCの3D Wafer-On-Waferをベースにした世界初のプロセッサです。単一パッケージに600億個以上のトランジスタを搭載し、人工知能コンピューティング性能は350テラフロップスで、前世代のMK2 IPUの1.4倍です。オンチップストレージは前世代と比べて変更はなく、容量は依然として0.9GBを維持していますが、スループットは47.5TBから65TBに増加しています。

「主な変更点は、3Dパッケージプロセッサであり、トランジスタのサイズが大きくなり、計算能力とスループットが向上したことだ」と、Graphcore Greater Chinaの社長兼グローバル最高売上責任者であるLu Tao氏は述べた。皆さんが気になるプロセス技術に関しては、Bow IPUは前世代のTSMC 7nmプロセス技術を継承しており、変更はありません。

理論的には、チップの性能向上はプロセス技術の進歩に大きく依存しますが、プロセス技術が物理的限界に近づくにつれて、ムーアの法則は徐々に無効になり、業界はムーアの法則を継続するための新しい技術的方向性を見つける必要があります。その中でも、3D パッケージングは​​業界で広く支持されている技術方向性です。

中国工程院の院士であり、浙江大学マイクロナノエレクトロニクス学院の学長である呉漢明氏は、かつての講演で、チップ製造とチップパッケージングを組み合わせれば、40nmプロセスの性能と消費電力の要件を65nmプロセスで達成できると述べたことがある。

Bow IPU は、呉院士の見解を検証したばかりです。

Lu Tao氏は、Bow IPU製品のパフォーマンス向上は主に3D WoWと新しく追加されたダイによるものだと語った。

より高度なプロセスではなくパッケージング方法の変更を選択した理由について、Lu Tao 氏は、MK2 IPU には 594 億個のトランジスタがあり、面積は約 823 平方ミリメートルで、これはすでに単一の 7nm ダイで製造できる最も高度なチップであると述べました。

「7nm、5nm、3nmなど、異なるプロセスノードのメリットを評価したところ、7nmから5nmへの製造プロセス改善によってもたらされるメリットは、数十パーセントのメリットをもたらすことができた以前の28nmから14nmへのメリットとは異なり、20パーセントにまで低下していることがわかりました。現時点では、他の手段や方法で同じメリットを得ることができます。」

Bow IPUの2つのダイは、3Dスタッキングによりトランジスタ数が増加しています。ダイの1つ(Colossusダイ)は前世代と同じで、もう1つのダイは主にColossusダイ全体の電力伝送を改善し、Colossusダイの動作ノードを最適化するために使用され、効果的なクロック加速につながります。

TSMCとの協力について、Lu Tao氏はLeifeng.comに対し、Graphcoreは1年前にTSMCとテストチップで協力しており、TSMCとは非常に密接な関係にあると語った。また、AIプロセッサ自体は規模が大きく、実装をサポートするためにいくつかの新しい技術が必要である。TSMCの観点から見ると、新しい技術も需要のある製品と一緒に推進する必要がある。

パッケージ方法は変更されましたが、Bow IPU は箱から出してすぐに使用でき、コードを変更することなく前世代の製品と 100% ソフトウェア互換性があることは特筆に値します。古いユーザーはソフトウェアの適応作業を行わずにパフォーマンスの向上を得ることができ、価格も変わりません。

現在、米国のパシフィック・ノースウェスト国立研究所は、計算化学やネットワークセキュリティへの応用をターゲットに、Bow IPU に基づく Transformer ベースのモデルやグラフニューラルネットワークの開発を試みており、比較的肯定的なフィードバックを得ています。

3Dパッケージングを継続し、人間の脳を超える超知能機械を開発

Bow IPU の 3D パッケージングの使用は、単なる出発点にすぎません。Graphcore は将来を見据えて、人間の脳の処理能力を超える超インテリジェント マシンを開発しています。

Graphcore は開発中の製品を Good Computer と名付けました。一方では、コンピューターが世界に良い影響を与えることを期待し、他方では、有名なコンピューター科学者 Good に敬意を表しています。

3D WoW に基づき、将来 Good Computer には 8192 個の IPU が搭載され、10 エクサフロップス以上の AI コンピューティング能力が提供され、4 PB のストレージが実現され、500 兆を超えるパラメータ規模の人工知能モデルの開発を支援できるようになると予想されています。

構成に応じて、Good Computer のコストは 100 万ドルから 1 億 5000 万ドルになります。

陸涛氏は、Good Computerの開発は依然としてIPUアーキテクチャに従うと述べた。IPUのストレージはプロセッサ内部にある。脳のような、メモリコンピューティングやストレージとコンピューティングの統合とは呼ばれていないが、コンピューティングとストレージを組み合わせている点を除けば、IPUの動作メカニズムはある程度、脳コンピューティングの動作原理に近い。

さらに、Graphcore はソフトウェア側からのスパース化をより効果的にサポートし、脳のような計算能力を実現します。

<<:  2022年のインテリジェント運用保守(AIOps)の開発動向

>>:  ドローン空気検知器は環境保護にどのように役立つのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

...

人工知能における非構造化データの役割

人工知能 (AI) システムは人間に似た方法でやり取りするため、一部の人は不安に思うかもしれませんが...

産業用ロボットは国内でどのように普及できるのか?標準を第一にすることが鍵

近年、自動化の需要が継続的に高まり、人口ボーナス要因の影響も継続して受け、わが国の産業用ロボットは急...

高品質な人工知能メンタルヘルスカウンセリングアプリを開発するには?

生活の質は向上している一方で、人々の精神状態は悪化しています。 [[317751]]群衆の中にうつ病...

我が国の人工知能市場の規模は2022年に3705億元に達すると推定されている。

人工知能は、機械を通じて人間の思考と意思決定をシミュレートすることに重点を置いたコンピューターサイエ...

ケンブリッジ大学チームは約50年後に初めて量子スピン液体を検出し、その研究はサイエンス誌に掲載された。

[[439547]]一部の研究者は、量子コンピューターがいつの日かデジタル暗号の解読や薬剤の設計な...

人工知能が中小企業にもたらす5つのメリット

[[328993]] 【51CTO.com クイック翻訳】 AI 市場のトレンドはどのくらいの速さで...

GitHub が機械学習コードの脆弱性スキャンを無料で提供、JavaScript / TypeScript もサポート

現在、JavaScript および TypeScript リポジトリで開発およびテストが行​​われて...

OpenAIは、GPT-4の「怠惰」問題を近い将来に修正し、オフライン評価とA/Bテストの後にモデルを更新すると発表した。

IT Homeは12月12日、OpenAIが先週、一部のユーザーから苦情を受けたと報じた。多くのユ...

ビジネスでAIと自動化を活用する方法

業界の専門家が AI と自動化のベストプラクティスについて議論し、企業がこれらの重要な新興テクノロジ...

...

マシンビジョン: スマート製造のキーエンジン

インダストリアル 4.0 時代はインテリジェント製造と切り離せません。マシンビジョンは、現在の製造品...

...

なぜ人工知能には欠陥があるのでしょうか?

人工知能は、すべての人の生活に欠かせないものとなっています。 YouTube のおすすめなどの単純な...