背景近年、NLPの応用分野では大きな進歩がありました。Bert、GPT、GPT-3などの超大規模モデルがさまざまなNLPテストを席巻した後、モデルパラメータが大きいほどアルゴリズムのパフォーマンスが向上することがわかりました。そのため、大規模モデルの方向への開発が急速に進み、モデルサイズが爆発的に増加しました。大規模モデルのトレーニングが既存のトレーニング システムにもたらす主な課題は、メモリの負荷、コンピューティングの負荷、および通信の負荷です。 言語モデルのサイズは指数関数的に増加しています (出典: https://huggingface.co/blog/large-language-models) Volcano Engine 大規模モデルトレーニングフレームワーク veGiantModelこの需要に応えるために、ByteDance の AML チームは、Volcano Engine 用の大規模モデル トレーニング フレームワークである veGiantModel を開発しました。 veGiantModel は、PyTorch フレームワークをベースに、Megatron と DeepSpeed をベースにした高性能な大規模モデル トレーニング フレームワークです。機能は次のとおりです:
このうち、ByteCCLはByteDanceが開発したBytePSのアップグレード版であり、A100/V100などのさまざまなモデルトポロジー向けに階層化プロトコルの最適化が行われ、allgatherやalltoallなどのより包括的な通信プリミティブをサポートしています。 veGiantModel パフォーマンスハードウェア構成VeGiantModel のパフォーマンスを実証するために、veGiantModel チームは自社のコンピュータ ルームで物理マシンを使用し、A100 モデルと V100 モデルのテストを実施しました。実験構成は次のとおりです。
モデルとコントロールグループの選択veGiantModel は評価用に GPT-13B モデルを選択しました。シーケンス長は 256、グローバル バッチ サイズは 1536 です。 GPT は、市場で最も人気のあるトランスフォーマーベースの言語モデルです。パフォーマンス制御グループは、最も人気のあるオープンソース コミュニティ ツールである Megatron と DeepSpeed を選択しました。 テスト結果
上記のデータから、次のことがわかります。
原因分析veGiantModel が Megatron や DeepSpeed よりも高速なのはなぜですか?理由は次のとおりです。
ポータルveGiantModel は現在、次のアドレスの GitHub でオープンソース化されています。 https://github.com/volcengine/veGiantModel GitHub では、veGiantModel の使用方法と、veGiantModel を使用して GPT 事前トレーニングをすばやく実行する方法について詳しく説明しています。 Volcano Engine 機械学習プラットフォームは、veGiantModel をネイティブにサポートしています。このプラットフォームは現在パブリック ベータ版であり、誰でも試すことができます: https://www.volcengine.com/product/ml-platform |
<<: AIカーゴのロープロファイルバージョン?ネットユーザーがCNN1台を使って「ニード・フォー・スピード9」でレース
最近、OpenAIとGoogleが率いるアメリカのテクノロジー大手7社が共同で次のような発表を行った...
友達に大きなサプライズ!マスク氏は突然、Grokの大型モデルを大量の有料ユーザーに開放すると発表した...
[[440343]] MIT-IBM Watson AI Labの主任科学者であるガン・チュアン氏...
北京日報によると、異なる消費者が同じ電子商取引プラットフォーム上で同じキーワードを使用して商品を検索...
[[240152]]人工知能技術が成熟するにつれ、この技術のより広範な社会的、倫理的影響に十分な注意...
ロボットや機械が下す決定は必ずしも道徳的に正しいとは限りません。テクノロジー企業が機械倫理に注目する...
[[415286]]注意メカニズムは、最初はコンピューター ビジョンで使用され、その後 NLP の分...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
11月3日、中央気象台は今年初の黄色寒波警報を発令し、最強の寒波が来ています!警報によると、11月...
業界の専門家が、業界内で発生する運用上の課題の解決に AI がどのように役立つか、データ センター業...
機械学習プラットフォームを構築する以前、iQiyi にはすでに比較的成熟したディープラーニング プラ...
マイクロソフトは10月27日、エンタープライズアプリケーションカンファレンスにおいて、ローコードプラ...