6月27日、マイクロソフトの研究者らは、大規模なAIモデルのトレーニング時に遭遇しやすいデータ転送コストと帯域幅制限を最適化し、大規模モデルのトレーニングにかかる時間とコストを大幅に削減できる「ZeRO++」という新技術を新たに発表した。 ZeRO++ は既存の ZeRO 伝送技術に基づいて構築されており、トレーニングの時間とコストを削減しながらトレーニングの効率を向上させる強化された通信戦略を提供すると報告されています。 ▲ 画像出典:Microsoft パラメータ通信の量を減らすために、ZeRO++ は重みを量子化できます。ブロックベースの量子化方法を使用して、トレーニングの精度を維持します。この最適化された量子化プロセスは、元の Zero 伝送テクノロジよりも高速で正確です。通信オーバーヘッドを最小限に抑えるために、ZeRO++ は各マシンにモデルの完全なコピーを維持し、GPU メモリを通信帯域幅と交換します。勾配通信に関しては、ZeRO++ は qgZ と呼ばれる新しい量子化勾配通信方式を導入し、ノード間のトラフィックとレイテンシを削減できます。 ▲ 画像出典:Microsoft これらの改善された通信技術により通信量が大幅に削減され、Microsoft の研究者は、ZeRO++ は ZeRO と比較して通信量を最大 4 倍削減し、トレーニングのスループットと効率を向上させると述べています。各 GPU で小さなバッチ サイズを使用すると、ZeRO++ は高帯域幅クラスターで ZeRO-3 よりも 28% ~ 36% 高いスループットを実現します。低帯域幅のクラスターでは、ZeRO++ は ZeRO-3 と比較して平均 2 倍の高速化を実現し、より多様なクラスターで大規模なモデルのトレーニングをより実現可能にします。 IT Home 注: IT Home は、Turing-NLG、ChatGPT、GPT-4 などの大規模モデルのトレーニングには、複数の GPU デバイスにわたる大量のビデオ メモリとコンピューティング リソースが必要であることに気付きました。ZeRO++ では、低帯域幅のクラスターでトレーニングする場合に、元の ZeRO 伝送テクノロジの帯域幅制限を克服するための通信最適化戦略を導入しています。 Microsoft は現在、関連する技術ドキュメントを公開しており、研究者は ZeRO++ を使用してモデルをより効率的にトレーニングし、AI 分野における新たな可能性を探求することができます。 |
<<: 人工知能に関する詳細な調査:AIツールを使ったことがある人は思っているほど考えていない
>>: 自律走行車の障害物回避、経路計画、制御技術の詳細な説明
[[361065]]いたずら好きな老人の周伯同は、黄耀師によって桃花島に十数年閉じ込められていまし...
12月17日、浙江省徳清国際会議センターで2019年中国スマート企業発展フォーラムが開催され、工業情...
モバイルインターネット技術のサポートにより、オーディオソーシャルネットワーキングは、さまざまなシナリ...
2023年に終了した国際学術会議AIBT 2023において、Ratidar Technologies...
今日のロボットは、次のようなさまざまな形やサイズのものがあります。こんなのもあります:一見奇妙に見え...
清華大学は、世界初の異種融合脳型コンピューティングチップ「天機チップ」を開発しました。このチップで駆...
ディープラーニングの研究者として、私はモデルのトレーニングに深く悩まされています。モデルを何日も何晩...
ヒューマンマシンインターフェースがなければ、ドライバーは自動運転車 (AV) と通信できません。さら...
[[198507]]誰の生活も金融から独立して存在することはできません。テクノロジーの発展により人々...
本稿では、海外の人工知能分野の科学技術発展の現状を調査し、その発展動向を判断するために、2021年の...
CEO を雇い、チームを雇い、CEO を復帰させ、取締役会に加わらせる - Microsoft はO...
中国自動車工程協会と国家インテリジェントコネクテッドビークルイノベーションセンターは、「2021年第...
3D ポートレート合成は、常に AIGC の注目を浴びている分野です。 NeRF と 3D 対応 ...