マイクロソフト、大規模 AI モデルのトレーニングにかかる​​時間とコストを大幅に削減する ZeRO++ テクノロジーを発表

マイクロソフト、大規模 AI モデルのトレーニングにかかる​​時間とコストを大幅に削減する ZeRO++ テクノロジーを発表

6月27日、マイクロソフトの研究者らは、大規模なAIモデルのトレーニング時に遭遇しやすいデータ転送コストと帯域幅制限を最適化し、大規模モデルのトレーニングにかかる​​時間とコストを大幅に削減できる「ZeRO++」という新技術を新たに発表した

ZeRO++ は既存の ZeRO 伝送技術に基づいて構築されており、トレーニングの時間とコストを削減しながらトレーニングの効率を向上させる強化された通信戦略を提供すると報告されています。

▲ 画像出典:Microsoft

パラメータ通信の量を減らすために、ZeRO++ は重みを量子化できます。ブロックベースの量子化方法を使用して、トレーニングの精度を維持します。この最適化された量子化プロセスは、元の Zero 伝送テクノロジよりも高速で正確です。通信オーバーヘッドを最小限に抑えるために、ZeRO++ は各マシンにモデルの完全なコピーを維持し、GPU メモリを通信帯域幅と交換します。勾配通信に関しては、ZeRO++ は qgZ と呼ばれる新しい量子化勾配通信方式を導入し、ノード間のトラフィックとレイテンシを削減できます。

▲ 画像出典:Microsoft

これらの改善された通信技術により通信量が大幅に削減され、Microsoft の研究者は、ZeRO++ は ZeRO と比較して通信量を最大 4 倍削減し、トレーニングのスループットと効率を向上させると述べています。各 GPU で小さなバッチ サイズを使用すると、ZeRO++ は高帯域幅クラスターで ZeRO-3 よりも 28% ~ 36% 高いスループットを実現します。低帯域幅のクラスターでは、ZeRO++ は ZeRO-3 と比較して平均 2 倍の高速化を実現し、より多様なクラスターで大規模なモデルのトレーニングをより実現可能にします。

IT Home 注: IT Home は、Turing-NLG、ChatGPT、GPT-4 などの大規模モデルのトレーニングには、複数の GPU デバイスにわたる大量のビデオ メモリとコンピューティング リソースが必要であることに気付きました。ZeRO++ では、低帯域幅のクラスターでトレーニングする場合に、元の ZeRO 伝送テクノロジの帯域幅制限を克服するための通信最適化戦略を導入しています。 Microsoft は現在、関連する技術ドキュメントを公開しており、研究者は ZeRO++ を使用してモデルをより効率的にトレーニングし、AI 分野における新たな可能性を探求することができます。

<<:  人工知能に関する詳細な調査:AIツールを使ったことがある人は思っているほど考えていない

>>:  自律走行車の障害物回避、経路計画、制御技術の詳細な説明

ブログ    
ブログ    

推薦する

アイティ族テクニカルクリニック第6回

【51CTO.comオリジナル記事】 [51CTO オリジナル記事、パートナーサイトに転載する場合は...

次世代モバイルコンピューティングの予測

テクノロジーは前例のない速度で進歩しており、モバイル コンピューティングの将来は変革的な進歩を約束し...

...

...

AIコピーライティングの11のメリット

この記事では、AI がコピーライターにもたらす 11 のメリットの一部と、次のプロジェクトで AI ...

「インターネット情報サービスアルゴリズム推奨管理規則」が公布され、3月1日に発効される。

最近、中国サイバースペース管理局、工業情報化部、公安部、国家市場監督管理総局は共同で「インターネット...

2024 年の産業用ロボットのトップ 10 のトレンドとイノベーション

産業用ロボットの世界では、イノベーションのペースが加速し続けており、毎年、製造、自動化、作業の方法を...

電流制限アルゴリズムを理解すれば十分です。

TL;DR (長すぎるので読まないでください)現在の制限アルゴリズム: カウンター、スライディング...

心臓血管疾患における人工知能の応用

人工知能(AI)は、知識の学習、知識の保存、思考、計画という人間の脳の思考プロセスをシミュレートする...

MITの研究者はAIを使って自動運転車が赤信号でアイドリングを回避できるように支援する

ドライバーが毎回信号を直進できるように旅行を計画できたらどうなるでしょうか?これは、特に幸運な状況下...

...

テンセントは大人のプレイヤーから厳しい批判を受けた!実名認証だけでは不十分、顔認証も必要

[[422724]]今学期の一番の話題は、未成年がゲームをプレーできなくなった平日です!これにより、...

...

人工知能の根幹技術を徹底的に分析

AIチップ・AIフレームワークの代表的企業コンピューティングアルゴリズムの重要な基盤として、人工知能...

Huaweiの推奨システムにおけるマルチタスクとマルチシナリオの応用

1. マルチタスクとマルチシナリオの背景と課題まず、Huaweiのマルチタスクで推奨されるシナリオを...