2020 年のディープラーニングに最適な GPU の概要。どれが最適かを確認してください。

2020 年のディープラーニングに最適な GPU の概要。どれが最適かを確認してください。

ビッグデータダイジェスト制作

出典: lambdalabs

編纂者:張秋月

ディープラーニング モデルが強力になるにつれて、より多くのメモリ領域を占有しますが、多くの GPU にはトレーニングに十分な VRAM がありません。

では、ディープラーニングを始める準備ができたら、どのような GPU が最も適しているのでしょうか? ここでは、ディープラーニング モデルのトレーニングに適した GPU のリストと、それらを横並びで比較します。見てみましょう。

長すぎて読めない

2020 年 2 月現在、以下の GPU で現在のすべての言語モデルと画像モデルをトレーニングできます。

  • RTX 8000: 48GB VRAM、約5,500ドル
  • RTX 6000: 24GB VRAM、約4,000ドル
  • Titan RTX: 24GB VRAM、約2,500ドル

次の GPU は、ほとんどの (ただしすべてではない) モデルをトレーニングできます。

  • RTX 2080 Ti: 11GB VRAM、約1,150ドル
  • GTX 1080 Ti: 11GB VRAM、工場再生品で約800ドル
  • RTX 2080: 8GB VRAM、約720ドル
  • RTX 2070: 8GB VRAM、約500ドル

次の GPU は現在のモデルのトレーニングには適していません。

  • RTX 2060: 6GB VRAM、約359ドル。

この GPU でのトレーニングには比較的小さなバッチ サイズが必要であり、モデルの分布近似が影響を受け、モデルの精度が低下します。

画像モデル

メモリ不足になる前の最大バッチ サイズ:

*GPU にモデルを実行するのに十分なメモリがないことを示します。

パフォーマンス(1秒あたりに処理される画像数):

*GPU にモデルを実行するのに十分なメモリがないことを示します。

言語モデル

メモリ不足になる前の最大バッチ サイズ:

*GPU にモデルを実行するのに十分なメモリがないことを示します。

パフォーマンス:

* GPU にはモデルを実行するのに十分なメモリがありません。

Quadro RTX 8000の結果を使用して正規化されたパフォーマンス

画像モデル:

言語モデル

結論は

  • 言語モデルは、画像モデルよりも大きな GPU メモリの恩恵を受けます。右側の曲線が左側の曲線よりも急であることに注意してください。これは、言語モデルはメモリ サイズによってより制限され、画像モデルは計算能力によってより制限されることを示しています。
  • より大きなバッチ サイズを使用すると CUDA コアが飽和するため、VRAM が大きい GPU の方がパフォーマンスが向上します。
  • VRAM が大きい GPU では、比例して大きなバッチ サイズを実現できます。小学校レベルの数学しか知らない人なら、これが理にかなっていることがわかるでしょう。24 GB の VRAM を搭載した GPU は、8 GB の VRAM を搭載した GPU の 3 倍のバッチを処理できます。
  • 長いシーケンスの言語モデルは、シーケンスの長さの 2 乗で注意が集中するため、他のモデルと比較して不釣り合いに大量のメモリを消費します。

GPU 購入の推奨事項

  • RTX 2060 (6 GB): 空き時間にディープラーニングを探求したい。
  • RTX 2070 または 2080 (8 GB): ディープラーニングに真剣に取り組んでいますが、GPU 予算は 600 ~ 800 ドルです。 8 GB の VRAM はほとんどのモデルに適しています。
  • RTX 2080 Ti (11 GB): ディープラーニングに真剣に取り組んでおり、GPU 予算は約 1,200 ドルです。 RTX 2080 Ti は RTX 2080 よりも約 40% 高速です。
  • Titan RTX および Quadro RTX 6000 (24 GB): 最新モデルを頻繁に使用していますが、RTX 8000 を購入する予算がありません。
  • Quadro RTX 8000 (48 GB): 将来への投資をお考えの場合、または 2020 年の最新かつ最もクールなモデルをお探しの場合。

注記

画像モデル:

言語モデル:

関連レポート: https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  Huawei のフルシナリオ AI コンピューティング フレームワーク MindSpore がオープン ソースになりました。

>>:  人工知能は優秀な医師の役割を果たすのでしょうか?

ブログ    
ブログ    

推薦する

「アドビの父」が82歳で逝去!ガレージで始まり、PostScriptを発明し、伝説的な人生で世界を変えた

アドビの共同創業者ジョン・ワーノック氏が19日、82歳で亡くなった。本日、Adobe は公式に発表を...

...

...

AIが「ツール人」を救う: RPA+AIがすべてを自動化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

任正非氏、人工知能の応用について語る:すべてをインテリジェントにしてはいけない、さもないとすべてが失敗する

最近、ファーウェイの新生コミュニティ公式アカウントは、任正非のGTS人工知能応用セミナーでの講演を公...

...

2019年の中国の人工知能産業と産業配置の分析

[[282510]] 11月9日、ロシアのプーチン大統領はモスクワで開かれた第一回「人工知能への旅」...

...

...

自動で本を書いてくれるChatGPTプラグイン3つが人気に。何もしなくてもAI自身にお金を稼ぐ方法をもっと質問できる!

ChatGPT プラグインの数が爆発的に増加しました!総数は390に達し、オープン当初の74に比べ...

ディープラーニングは他の画像処理アルゴリズムを置き換えることができますか?

近年、ディープラーニング技術の登場により、視覚画像処理はますます普及し、さまざまな分野で広く利用され...

JavaScript: ソートアルゴリズムとコード実装のトップ 10

この記事の内容には、(双方向) バブル ソート、選択ソート、挿入ソート、クイック ソート (穴埋めと...

分散キャッシュの実装: Java と MongoDB のキャッシュ一貫性戦略

インターネット アプリケーションの急速な発展に伴い、分散システムにおけるキャッシュが重要な役割を果た...

アルゴリズムのインテリジェントなアップグレードにより、将来のデジタルライフはより明るくなります

[[120716]]研究者たちは現在、検索結果の改善、自動運転車、スマート携帯電話のアップグレード、...

韓国はLK-99の室温超伝導は証明できないと信じており、国内チームは拡張された材料が魔法のような特性を持っていると信じている

韓国でセンセーショナルな「常温超伝導」事件が最近終息したようだ。韓国超伝導低温学会の検証委員会は最近...