OpenAI も参入したいと考えている GPU とは一体何でしょうか?

ChatGPTなどの大規模言語モデルがAI変革の新たな波を引き起こすにつれ、AIチップの不足はますます深刻化しています。たとえば、ChatGPT の開発元である OpenAI は、Microsoft が提供するスーパーコンピューターに大きく依存しており、多数の Nvidia GPU を使用しています。最近、OpenAIが自社の事業に必要な高性能かつ低コストのGPUの問題を解決するために、AIチップを独自に製造または取得することを検討しているとの報道がありました。

今日は、OpenAI が取り組みたい GPU についてお話ししましょう。

GPUとは

「千種類の携帯電話には千種類のゲーム体験がある。」異なる携帯電話でゲームをプレイすると、体験が異なります。応答速度に加えて、ゲーム画面の精巧さと立体感も大きな違いです。この違いを引き起こす要因の1つは、携帯電話のGPUの性能の違いです。

GPU（グラフィックスプロセッシングユニット）は、携帯電話やコンピューターに隠されたスーパーヒーローであり、色鮮やかな絵を素早く描くことができるプロの画家であるだけでなく、大量のコンピューティングタスクを素早く完了できる数学者でもあります。

専門的に言えば、GPU はグラフィック処理専用に設計されたプロセッサです。大量のグラフィックレンダリング計算を非常に高速に処理でき、複数のグラフィックタスクを同時に処理できるため、コンピューターの計算および処理速度が大幅に向上します。

写真

GPU はもともとグラフィック処理用に設計されましたが、並列処理と高速コンピューティング機能により、GPU はますます重要な役割を果たすようになりました。 GPUは現在、科学計算、機械学習、ビッグデータ分析などの分野で広く使用されています。

コンピューター内の GPU は、統合 GPU と独立 GPU の 2 種類に分けられます。

統合型 GPU はサイズが小さく、通常はコンピューターのマザーボードに組み込まれているか、CPU に統合されています。統合型 GPU によりコンピューターの軽量化が可能になり、ラップトップによく搭載されています。
独立した GPU はサイズが大きく、コンピューターのマザーボード上に専用のソケットを備えた独立したコンポーネントです。統合 GPU よりも強力で、個別にアップグレードできます (グラフィックカードを交換することによって)。ただし、サイズが大きいため、コンピューター内でより多くのスペースを占め、より多くのエネルギーを消費し、実行時により多くの熱を発生します。

一部のラップトップには、両方のタイプの GPU が搭載されています。一般的に、統合 GPU は、エネルギーを節約し、発熱を抑えるために使用されます。より強力なグラフィック処理パフォーマンスが必要な場合は、独立した GPU に切り替えて、関連するタスクを実行します。

GPU と CPU の違いは何ですか?

これを見て、コンピューターのもう一つの重要な役割であるCPU（中央処理装置）を思い浮かべますか？では、GPUとCPUの違いは何でしょうか？

どちらもコンピューティングタスクを実行できますが、機能は異なります。 CPU がどんな問題も解ける知識豊富な数学教授だとすると、GPU は 1 万人の小学生です。数の力があり、簡単な数学の問題を計算するときは速度が極めて速いです。

写真

実際、GPU が登場する前は、基本的にすべてのタスクは CPU によって実行されていました。 GPU が発明されてから、この 2 つは別々に動作するようになりました。次の表に、それらの違いを示します。

写真

上記の比較から、GPU と CPU にはそれぞれ独自の強みがあることがわかります。携帯電話とコンピューターでは、両者が協力し合い、仕事を分担し、協力して私たちにサービスを提供しています。

GPUはAIに適している

前回の紹介から、GPU は大規模な並列コンピューティングに非常に適していることがわかります。 AI (人工知能) のトレーニングには、特にディープラーニングの分野では大量のデータ処理が伴います。ネットワークモデルには通常、数百万、場合によっては数十億のパラメーターがあり、正確な予測を得るには大量のデータでトレーニングする必要があります。そのため、GPU は AI アルゴリズムに非常に適しています。

写真

並列処理機能

GPU は多数のコアと高速メモリを備えており、並列計算に優れています。 AI の分野では計算量が非常に多いため、このシナリオには GPU が最適です。簡単な数学の問題を大量に計算する必要がある場合、1人の教授よりも1万人の小学生の方が断然適しているようなものです。

メモリ帯域幅の拡大

一般的な GPU メモリ帯域幅は約 400 GB/秒ですが、最高の CPU メモリ帯域幅は約 50 GB/秒であるため、GPU はメモリ内のデータをより高速に取得してアクセスできます。 AI の分野では、データは通常、連続したメモリ空間の大きなブロックを占有するため、GPU の方が明らかに適しています。

優れた柔軟性

GPU は、CUDA や OpenCL などのプログラミングフレームワークと言語の使用をサポートしているため、開発者は GPU の計算能力を簡単に活用し、GPU の計算タスクを高度にカスタマイズし、さまざまな種類の AI アルゴリズムのサポートを提供できます。

CUDA

Compute Unified Device Architecture は、NVIDIA が発表した汎用並列コンピューティングアーキテクチャであり、GPU が複雑なコンピューティング問題を解決できるようにします。

オープンCL

Open Computing Language は、スーパーコンピュータ、クラウドサーバー、パーソナルコンピュータ、モバイルデバイス、組み込みプラットフォームのさまざまなアクセラレータのクロスプラットフォーム並列プログラミングのためのオープンスタンダードです。

強力なスケーラビリティ

AI モデルの複雑さが増し、データ量が増えると、計算を実行する小学生を増やすのと同じように、GPU を追加することで処理能力を高めることができ、システムは増大するコンピューティングニーズに適切に対応できるようになります。

結論

最近、大規模モデルトレーニング用に設計されたZTEの主力GPUサーバーR6900 G5が、China Mobileのグローバルパートナーカンファレンスで発表され、優れたコンピューティング性能、高速ネットワーク通信機能、革新的なエネルギー効率性能により、人工知能やディープラーニングなどの分野で新たなブレークスルーをもたらしました。

<<:

>>: