ByteDanceが大規模モデルトレーニングフレームワークveGiantModelをオープンソース化、パフォーマンスが最大6.9倍向上

ByteDanceが大規模モデルトレーニングフレームワークveGiantModelをオープンソース化、パフォーマンスが最大6.9倍向上

最近、ByteDanceの応用機械学習チームは、veGiantModelという大規模モデルトレーニングフレームワークをオープンソース化しました。このトレーニングフレームワークは、主に自然言語処理分野の大規模モデルトレーニングに使用され、大規模モデルトレーニングのパフォーマンスを最大6.9倍向上させ、トレーニングシステムへの負荷を大幅に軽減します。現在、ByteDance 傘下のエンタープライズ レベルのテクノロジー サービス プラットフォームである Volcano Engine は、パブリック ベータ版である機械学習プラットフォームで veGiantModel をネイティブにサポートしています。

自然言語処理は、コンピューターが人間の言語を理解、解釈、使用できるようにすることを目的とした人工知能研究の重要な分野です。近年、自然言語処理は、主に BERT、GPT、GPT-3 などの事前トレーニング済み言語モデルの普及により、アプリケーションにおいて大きな進歩を遂げました。事前学習済みの言語モデルは、人工知能の分野ではインフラとなっていると言えます。大規模モデルの方がアルゴリズムのパフォーマンスが優れているため、事前トレーニング済みの言語モデルは近年、大規模モデルへの急速な傾向を示しています。しかし、モデル サイズの急速な増加は、主にメモリの圧力、コンピューティングの圧力、および通信の圧力に反映され、既存のトレーニング システムにかなりの課題をもたらしました。

大規模モデルのトレーニング シナリオにおいて既存のトレーニング システムが直面する上記の課題に対応するため、ByteDance の応用機械学習チームは、大規模モデル トレーニング フレームワーク veGiantModel を提案しました。

veGiantModel の中国語名は Volcano Engine Large Model Training Framework です。これは、オープンソースのディープラーニング フレームワーク PyTorch をベースにした高性能な大規模モデル トレーニング フレームワークであり、2 つの主要なオープンソースの主流トレーニング フレームワークである Megatron と DeepSpeed を基盤として構築されています。

veGiantModel は、データ並列、演算子分割、パイプライン並列の 3 つの分散並列戦略を同時にサポートでき、自動化およびカスタマイズされた並列戦略をサポートします。Byte が開発した高性能非同期通信ライブラリである ByteCCL に基づいて、veGiantModel のトレーニング タスク スループットは、他の主流のオープン ソース フレームワークよりも 1.2 ~ 3.5 倍高く、より使いやすく柔軟なパイプライン サポートを提供し、モデル開発と反復に必要な人員を削減します。さらに、veGiantModel は、数十億から数千億のパラメーターを持つ大規模なモデルを GPU 上で効率的にサポートでき、ネットワーク帯域幅の要件が低く、プライベートに展開する場合に RDMA に大きく依存しません。

MegtraonとDeepSpeedとの比較テストでは、veGiantModelが最も優れたパフォーマンスを発揮し、ネットワーク帯域幅の影響が最も少ないことが示されました。Tesla V100では上記2つよりも1.2~3.5倍、Ampere A100では最大6.9倍のパフォーマンス向上が見られました。


veGiantModel オープンソースアドレス:

https://github.com/volcengine/veGiantModel

Volcano Engine 機械学習プラットフォーム パブリックベータ アドレス:

​​https://www.volcengine.com/product/ml-platform​​


<<:  自動運転トラックはレベル4を達成する可能性が最も高いが、自動運転車は2022年まで待たなければならない

>>:  ロボットをもっと速く走らせたい?人工知能で制御しよう

ブログ    
ブログ    
ブログ    

推薦する

ガートナー、中国企業向け人工知能トレンド ウェーブ 3.0 を発表

2023 年 6 月 13 日 – 先日開催された 2023 年 Greater China Exe...

ロボット革命が到来。人類社会はどう対応すべきか?

ロボット革命は、2009年に英国王立工学アカデミーが発表した「自律システム」と題する科学報告書で提唱...

今後 20 年間で、人工知能ロボットが介護士に取って代わり、高齢者の世話をすることになり、介護士よりも信頼できる存在になるでしょう。

人工知能の発達により、数十年、あるいは12年後には、人々は介護者やロボットを使って高齢者の世話をする...

...

ミツバチたちは、巣を監視し、餌を自動で分配できる多機能ロボットを搭載したこのスマートな巣箱に感銘を受けています。

ビッグデータダイジェスト制作著者: カレブスマート農場はますます私たちの身近なものになってきています...

年末には自動運転が実りある成果を上げ、その後の開発はワンストップサービスとなるでしょう!

2021年末までに、自動運転車の商業化は再び目覚ましい成果を達成しました。当社の統計によると、12...

機械学習アルゴリズムの比較

[[176276]]この記事では、主に、一般的に使用されているいくつかのアルゴリズムの適応シナリオと...

映画はヒットできるでしょうか?機械学習を使用して正確な予測を行う

映画データベース (TMDB) は映画データ用の API を提供し、ユーザーはこのデータベースからデ...

機械学習に関する9つのよくある誤解

[51CTO.com からのオリジナル記事] 現在、機械学習テクノロジーをめぐっては多くの誇大宣伝が...

AI は無限であり、あなたの声によって動かされます。マイクロソフトは慈善団体や業界のパートナーと協力し、テクノロジーで愛を育むお手伝いをします。

12月2日、マイクロソフトと周迅のAI音声紅丹丹慈善プロジェクトの発起人である魯音源文化伝承社は、...

AIが人間の職業を「置き換える」ためのロードマップ

昨日、私はこのような図を見ました。AI がどのように人間に取って代わるかを示すレベル図です。写真写真...

中国チームの「6軸セル3Dプリンター」が雑誌でトップに!心筋組織は体外で6ヶ月以上生存する

3Dバイオプリンティング技術は、3Dプリンターを使用して細胞や生物学的材料を含む「インク」を特定の形...

音声認識:市場の見通しは有望だが、コア技術にはまだブレークスルーが必要

人工知能製品が私たちの生活の中でますます普及するにつれて、テクノロジーの発展は社会の関心の焦点となっ...

AIを活用した臨床モニタリングシステムの台頭

[[355709]]現在、医療システムもさまざまな方法で人工知能の利点を取り入れています。人工知能(...