OpenAI も参入したいと考えている GPU とは一体何でしょうか?

OpenAI も参入したいと考えている GPU とは一体何でしょうか?

ChatGPTなどの大規模言語モデルがAI変革の新たな波を引き起こすにつれ、AIチップの不足はますます深刻化しています。たとえば、ChatGPT の開発元である OpenAI は、Microsoft が提供するスーパーコンピューターに大きく依存しており、多数の Nvidia GPU を使用しています。最近、OpenAIが自社の事業に必要な高性能かつ低コストのGPUの問題を解決するために、AIチップを独自に製造または取得することを検討しているとの報道がありました。

今日は、OpenAI が取り組みたい GPU についてお話ししましょう。

GPUとは

「千種類の携帯電話には千種類のゲーム体験がある。」異なる携帯電話でゲームをプレイすると、体験が異なります。応答速度に加えて、ゲーム画面の精巧さと立体感も大きな違いです。この違いを引き起こす要因の1つは、携帯電話のGPUの性能の違いです。

GPU(グラフィックス プロセッシング ユニット)は、携帯電話やコンピューターに隠されたスーパーヒーローであり、色鮮やかな絵を素早く描くことができるプロの画家であるだけでなく、大量のコンピューティング タスクを素早く完了できる数学者でもあります。

専門的に言えば、GPU はグラフィック処理専用に設計されたプロセッサです。大量のグラフィック レンダリング計算を非常に高速に処理でき、複数のグラフィック タスクを同時に処理できるため、コンピューターの計算および処理速度が大幅に向上します。

写真

GPU はもともとグラフィック処理用に設計されましたが、並列処理と高速コンピューティング機能により、GPU はますます重要な役割を果たすようになりました。 GPUは現在、科学計算、機械学習、ビッグデータ分析などの分野で広く使用されています。

コンピューター内の GPU は、統合 GPU と独立 GPU の 2 種類に分けられます。

  • 統合型 GPU はサイズが小さく、通常はコンピューターのマザーボードに組み込まれているか、CPU に統合されています。統合型 GPU によりコンピューターの軽量化が可能になり、ラップトップによく搭載されています。
  • 独立した GPU はサイズが大きく、コンピューターのマザーボード上に専用のソケットを備えた独立したコンポーネントです。統合 GPU よりも強力で、個別にアップグレードできます (グラフィック カードを交換することによって)。ただし、サイズが大きいため、コンピューター内でより多くのスペースを占め、より多くのエネルギーを消費し、実行時により多くの熱を発生します。

一部のラップトップには、両方のタイプの GPU が搭載されています。一般的に、統合 GPU は、エネルギーを節約し、発熱を抑えるために使用されます。より強力なグラフィック処理パフォーマンスが必要な場合は、独立した GPU に切り替えて、関連するタスクを実行します。

GPU と CPU の違いは何ですか?

これを見て、コンピューターのもう一つの重要な役割であるCPU(中央処理装置)を思い浮かべますか?では、GPUとCPUの違いは何でしょうか?

どちらもコンピューティングタスクを実行できますが、機能は異なります。 CPU がどんな問題も解ける知識豊富な数学教授だとすると、GPU は 1 万人の小学生です。数の力があり、簡単な数学の問題を計算するときは速度が極めて速いです。

写真

実際、GPU が登場する前は、基本的にすべてのタスクは CPU によって実行されていました。 GPU が発明されてから、この 2 つは別々に動作するようになりました。次の表に、それらの違いを示します。

写真

写真

上記の比較から、GPU と CPU にはそれぞれ独自の強みがあることがわかります。携帯電話とコンピューターでは、両者が協力し合い、仕事を分担し、協力して私たちにサービスを提供しています。

GPUはAIに適している

前回の紹介から、GPU は大規模な並列コンピューティングに非常に適していることがわかります。 AI (人工知能) のトレーニングには、特にディープラーニングの分野では大量のデータ処理が伴います。ネットワーク モデルには通常、数百万、場合によっては数十億のパラメーターがあり、正確な予測を得るには大量のデータでトレーニングする必要があります。そのため、GPU は AI アルゴリズムに非常に適しています。

写真

並列処理機能

GPU は多数のコアと高速メモリを備えており、並列計算に優れています。 AI の分野では計算量が非常に多いため、このシナリオには GPU が最適です。簡単な数学の問題を大量に計算する必要がある場合、1人の教授よりも1万人の小学生の方が断然適しているようなものです。

メモリ帯域幅の拡大

一般的な GPU メモリ帯域幅は約 400 GB/秒ですが、最高の CPU メモリ帯域幅は約 50 GB/秒であるため、GPU はメモリ内のデータをより高速に取得してアクセスできます。 AI の分野では、データは通常、連続したメモリ空間の大きなブロックを占有するため、GPU の方が明らかに適しています。

優れた柔軟性

GPU は、CUDA や OpenCL などのプログラミング フレームワークと言語の使用をサポートしているため、開発者は GPU の計算能力を簡単に活用し、GPU の計算タスクを高度にカスタマイズし、さまざまな種類の AI アルゴリズムのサポートを提供できます。

CUDA

Compute Unified Device Architecture は、NVIDIA が発表した汎用並列コンピューティング アーキテクチャであり、GPU が複雑なコンピューティング問題を解決できるようにします。

オープンCL

Open Computing Language は、スーパーコンピュータ、クラウド サーバー、パーソナル コンピュータ、モバイル デバイス、組み込みプラットフォームのさまざまなアクセラレータのクロスプラットフォーム並列プログラミングのためのオープン スタンダードです。

強力なスケーラビリティ

AI モデルの複雑さが増し、データ量が増えると、計算を実行する小学生を増やすのと同じように、GPU を追加することで処理能力を高めることができ、システムは増大するコンピューティング ニーズに適切に対応できるようになります。

結論

最近、大規模モデルトレーニング用に設計されたZTEの主力GPUサーバーR6900 G5が、China Mobileのグローバルパートナーカンファレンスで発表され、優れたコンピューティング性能、高速ネットワーク通信機能、革新的なエネルギー効率性能により、人工知能やディープラーニングなどの分野で新たなブレークスルーをもたらしました。

<<: 

>>: 

ブログ    
ブログ    

推薦する

JavaScript: ソートアルゴリズムとコード実装のトップ 10

この記事の内容には、(双方向) バブル ソート、選択ソート、挿入ソート、クイック ソート (穴埋めと...

...

プロジェクトを始めたいけれど、どこから始めればいいのか分からないですか?興味深いオープンソースの機械学習プロジェクト7つを試してみる

プロジェクトを実行することが機械学習を学ぶ唯一の方法であり、興味深く価値のあるプロジェクトを見つける...

...

AI、機械学習、ディープラーニングの解放

【51CTO.com クイック翻訳】 [[393512]] AI、機械学習、ディープラーニングの発展...

...

人工知能は工場のメンテナンスに大きな役割を果たすだろう

検出が難しい機械の故障は最もコストがかかるため、経験豊富な修理技術者の需要が高まっています。今日、多...

リアルタイムのテキストおよび画像処理の速度が 5 ~ 10 倍向上しました。Tsinghua LCM/LCM-LoRA は人気を博し、視聴回数は 100 万回を超えました。

テキストから作成された画像や写真から作成された画像は、新しいものではありません。しかし、これらのツー...

インテリジェント運転システムの欠陥解決策の詳細な分析

従来の自動車と比較して、自動運転車は、車両が乗客を安全に目的地まで輸送できるかどうかという実用的な目...

外国人大学生がAIモデルを発明:人間の目では真偽の判別が難しい中国の山水画を素早く生成できる

最近、プリンストン大学の学部生であるアリス・シューさんが卒業論文でプリンストン2020年度優秀卒業論...

...

...

Baidu World 2020 | Baidu CTO 王海鋒が Baidu Brain 6.0 をリリース、AI の新インフラストラクチャが業界インテリジェンスを加速

もし20年前の自分に会って会話ができたら、何を話しますか?想像する必要はありません。まるでSF映画の...

CPUのみを使用して1000FPSで実行できます。これはオープンソースのC++クロスプラットフォーム顔検出プロジェクトです。

さまざまな依存環境によって常に荒廃していますか?コンピューターと携帯電話の両方で実行できる、C++ ...

データがあなたを監視することに抵抗はありませんか?

AI 技術の発展と影響に関する最近の調査、研究、予測、その他の定量的評価により、消費者はデータのプ...