OpenAI も参入したいと考えている GPU とは一体何でしょうか?

OpenAI も参入したいと考えている GPU とは一体何でしょうか?

ChatGPTなどの大規模言語モデルがAI変革の新たな波を引き起こすにつれ、AIチップの不足はますます深刻化しています。たとえば、ChatGPT の開発元である OpenAI は、Microsoft が提供するスーパーコンピューターに大きく依存しており、多数の Nvidia GPU を使用しています。最近、OpenAIが自社の事業に必要な高性能かつ低コストのGPUの問題を解決するために、AIチップを独自に製造または取得することを検討しているとの報道がありました。

今日は、OpenAI が取り組みたい GPU についてお話ししましょう。

GPUとは

「千種類の携帯電話には千種類のゲーム体験がある。」異なる携帯電話でゲームをプレイすると、体験が異なります。応答速度に加えて、ゲーム画面の精巧さと立体感も大きな違いです。この違いを引き起こす要因の1つは、携帯電話のGPUの性能の違いです。

GPU(グラフィックス プロセッシング ユニット)は、携帯電話やコンピューターに隠されたスーパーヒーローであり、色鮮やかな絵を素早く描くことができるプロの画家であるだけでなく、大量のコンピューティング タスクを素早く完了できる数学者でもあります。

専門的に言えば、GPU はグラフィック処理専用に設計されたプロセッサです。大量のグラフィック レンダリング計算を非常に高速に処理でき、複数のグラフィック タスクを同時に処理できるため、コンピューターの計算および処理速度が大幅に向上します。

写真

GPU はもともとグラフィック処理用に設計されましたが、並列処理と高速コンピューティング機能により、GPU はますます重要な役割を果たすようになりました。 GPUは現在、科学計算、機械学習、ビッグデータ分析などの分野で広く使用されています。

コンピューター内の GPU は、統合 GPU と独立 GPU の 2 種類に分けられます。

  • 統合型 GPU はサイズが小さく、通常はコンピューターのマザーボードに組み込まれているか、CPU に統合されています。統合型 GPU によりコンピューターの軽量化が可能になり、ラップトップによく搭載されています。
  • 独立した GPU はサイズが大きく、コンピューターのマザーボード上に専用のソケットを備えた独立したコンポーネントです。統合 GPU よりも強力で、個別にアップグレードできます (グラフィック カードを交換することによって)。ただし、サイズが大きいため、コンピューター内でより多くのスペースを占め、より多くのエネルギーを消費し、実行時により多くの熱を発生します。

一部のラップトップには、両方のタイプの GPU が搭載されています。一般的に、統合 GPU は、エネルギーを節約し、発熱を抑えるために使用されます。より強力なグラフィック処理パフォーマンスが必要な場合は、独立した GPU に切り替えて、関連するタスクを実行します。

GPU と CPU の違いは何ですか?

これを見て、コンピューターのもう一つの重要な役割であるCPU(中央処理装置)を思い浮かべますか?では、GPUとCPUの違いは何でしょうか?

どちらもコンピューティングタスクを実行できますが、機能は異なります。 CPU がどんな問題も解ける知識豊富な数学教授だとすると、GPU は 1 万人の小学生です。数の力があり、簡単な数学の問題を計算するときは速度が極めて速いです。

写真

実際、GPU が登場する前は、基本的にすべてのタスクは CPU によって実行されていました。 GPU が発明されてから、この 2 つは別々に動作するようになりました。次の表に、それらの違いを示します。

写真

写真

上記の比較から、GPU と CPU にはそれぞれ独自の強みがあることがわかります。携帯電話とコンピューターでは、両者が協力し合い、仕事を分担し、協力して私たちにサービスを提供しています。

GPUはAIに適している

前回の紹介から、GPU は大規模な並列コンピューティングに非常に適していることがわかります。 AI (人工知能) のトレーニングには、特にディープラーニングの分野では大量のデータ処理が伴います。ネットワーク モデルには通常、数百万、場合によっては数十億のパラメーターがあり、正確な予測を得るには大量のデータでトレーニングする必要があります。そのため、GPU は AI アルゴリズムに非常に適しています。

写真

並列処理機能

GPU は多数のコアと高速メモリを備えており、並列計算に優れています。 AI の分野では計算量が非常に多いため、このシナリオには GPU が最適です。簡単な数学の問題を大量に計算する必要がある場合、1人の教授よりも1万人の小学生の方が断然適しているようなものです。

メモリ帯域幅の拡大

一般的な GPU メモリ帯域幅は約 400 GB/秒ですが、最高の CPU メモリ帯域幅は約 50 GB/秒であるため、GPU はメモリ内のデータをより高速に取得してアクセスできます。 AI の分野では、データは通常、連続したメモリ空間の大きなブロックを占有するため、GPU の方が明らかに適しています。

優れた柔軟性

GPU は、CUDA や OpenCL などのプログラミング フレームワークと言語の使用をサポートしているため、開発者は GPU の計算能力を簡単に活用し、GPU の計算タスクを高度にカスタマイズし、さまざまな種類の AI アルゴリズムのサポートを提供できます。

CUDA

Compute Unified Device Architecture は、NVIDIA が発表した汎用並列コンピューティング アーキテクチャであり、GPU が複雑なコンピューティング問題を解決できるようにします。

オープンCL

Open Computing Language は、スーパーコンピュータ、クラウド サーバー、パーソナル コンピュータ、モバイル デバイス、組み込みプラットフォームのさまざまなアクセラレータのクロスプラットフォーム並列プログラミングのためのオープン スタンダードです。

強力なスケーラビリティ

AI モデルの複雑さが増し、データ量が増えると、計算を実行する小学生を増やすのと同じように、GPU を追加することで処理能力を高めることができ、システムは増大するコンピューティング ニーズに適切に対応できるようになります。

結論

最近、大規模モデルトレーニング用に設計されたZTEの主力GPUサーバーR6900 G5が、China Mobileのグローバルパートナーカンファレンスで発表され、優れたコンピューティング性能、高速ネットワーク通信機能、革新的なエネルギー効率性能により、人工知能やディープラーニングなどの分野で新たなブレークスルーをもたらしました。

<<: 

>>: 

ブログ    
ブログ    

推薦する

...

認知分析について知っておくべきことすべて

コンテキストを提供し、大量の情報に隠された答えを発見するために、コグニティブ コンピューティングはさ...

二足歩行ロボット「キャシー」が機械学習を使って5kmのジョギングを完走

ロボット工学の世界では 4 年というのは長い期間ですが、特にオレゴン州立大学 (OSU) が開発した...

AIが建物をスマートにする5つの方法

[[407368]]今の世界は30年前とは大きく異なります。この変化の理由の一部は技術の発展です。今...

毎日のアルゴリズム: 二分木のレベルトラバーサル

[[423982]]バイナリ ツリーが与えられた場合、そのノード値のボトムアップ レベルのトラバーサ...

初心者必読: 5 つの反復レベルから機械学習を理解する

このなぞなぞの答えを推測できますか?機械学習を学べば、どこにでも登場します...プログラマーであれば...

興奮はテレビシリーズに匹敵、マスク氏とウルトラマン、そしてOpenAIとの「愛憎関係」

最近、マスク氏がOpenAIを訴えたというニュースがテクノロジー界に再び波紋を巻き起こしている。 1...

AIとRPA:両者の連携方法と、ビジネスに両方が必要な理由

ゴールドマン・サックスのレポートによると、AI は世界の労働生産性を年間 1% 以上向上させ、202...

...

クイックソートアルゴリズムの詳細な分析

[[121946]]序文以前、このブログでクイックソートアルゴリズムに関する人気のチュートリアル記事...

マスク氏とクック氏は秘密協定を結んだのか?アップルは「アップル税」でテスラに数百万ドルの節約をもたらす

ビッグデータダイジェスト制作著者: カレブ周知のとおり、Apple の App Store のポリシ...

人工知能技術がハリウッドスターを「若返らせる」

現代の若者は、ベテランスターたちの若い頃の見事な姿を見る機会がもうないが、それは問題ではない。人工知...

...

米国は、中国のAIチップ量子の3つの主要分野への投資を制限する最新の大統領令に署名しました。大手メーカーが50億ドル相当のA800を緊急発注

水曜日、ホワイトハウスは大統領令に署名した。米国は、中国の半導体設計ソフトウェアや製造ハードウェアへ...