Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Llama2 はオープンソースであり、無料の商用利用をサポートしているため、オープンソースの大規模モデルに対する業界の強い注目を集めています。 7 月 25 日、Alibaba Cloud は中国で先陣を切って、Llama2 の全バージョンを対象としたトレーニングおよび展開ソリューションを開始しました。Alibaba Cloud では、すべての開発者が Alibaba Cloud 上で独自の大規模モデルを構築することを歓迎します。

最近、Llama2 大規模言語モデルがオープンソース化され、70 億、130 億、700 億のパラメータを持つバージョンをカバーすることが発表されました。 Llama2 は、月間アクティブ ユーザー数が 7 億人未満の研究シナリオおよび商用シナリオで無料で使用でき、企業や開発者に大規模モデル研究のための新しいツールを提供します。しかし、特にパフォーマンスが優れた大規模バージョンの Llama2 を再トレーニングして展開するには、依然として高い障壁が存在します。

開発者を支援するために、アリババクラウドの機械学習プラットフォームPAIは、中国で初めてLlama2シリーズのモデルを深く適応させ、軽量の微調整、完全なパラメータの微調整、推論サービスなどのシナリオ向けのベストプラクティスソリューションを立ち上げ、開発者がLlama2に基づいて迅速に再トレーニングし、独自の大規模モデルを構築できるように支援しました。

Alibaba Cloud が立ち上げた AI モデル コミュニティである ModelScope が、Llama2シリーズ モデルを初めてリリースしました。開発者は、MoDa コミュニティの Llama2 モデル ページで「ノートブック クイック開発」をクリックすると、Alibaba Cloud 機械学習プラットフォーム PAI をワンクリックで起動し、クラウド上でモデルを開発して展開できます。他のプラットフォームからダウンロードした Llama2 モデルも、Alibaba Cloud PAI を使用して開発できます。

特別なシナリオ要件を満たすために、開発者は多くの場合、微調整トレーニング方法を使用してモデルを「調整」し、特定の分野の専門的な能力と知識を獲得する必要があります。現時点では、PAI は開発者がクラウド上で軽量の Lora 微調整やより詳細なフルパラメータの微調整を実行できるようにサポートしています。モデルの微調整が完了したら、PAI は開発者が Web UI と API を通じて Llama2 を展開できるようにサポートし、モデルが Web ページまたは組み込みアプリケーションを通じてユーザーと対話できるようにします。

Llama2のローカルスタンドアロントレーニングと比較して、超大規模モデルの詳細な開発はAlibaba Cloud上で完了できます。プリセット環境はメンテナンスフリーで操作が簡単です。同時に、開発者は豊富なAIコンピューティングリソースと極めて高い弾力性を得ることができます。ローカルのシングルカード GPU では、Llama2 の 70 億パラメータ バージョンの軽量 Lora 微調整と推論しか実行できません。より大きなバージョンやより深いトレーニングをサポートするのは困難です。 Alibaba Cloud では、PAI Lingjun Intelligent Computing サービスが提供する分散コンピューティング機能により、Llama2 のフルサイズ バージョンの軽量かつ完全なパラメータの微調整が可能になり、効率的な展開と推論が可能になります。

Alibaba Cloud は、世界トップ 3 のクラウド ベンダーの 1 つであり、アジア最大のクラウド ベンダーとして、中国の AI ブームの重要なリーダーおよびサービス プロバイダーであり、完全な IaaS + PaaS + MaaS 統合 AI サービスを構築しています。インフラレベルでは、アリババクラウドは中国最強のインテリジェントコンピューティングパワーの備蓄を保有しています。Lingjun Intelligent Computing Clusterは、最大10万枚のGPUカードの拡張性を備え、数兆個のパラメータを持つ複数の大規模モデルの同時オンライントレーニングをサポートできます。AIプラットフォームレベルでは、アリババクラウドの機械学習プラットフォームPAIが、AI開発プロセス全体にエンジニアリング機能を提供します。PAI Lingjun Intelligent Computingサービスは、Tongyi Qianwenなどの超大規模モデルのトレーニングとアプリケーションをサポートしており、大規模モデルのトレーニングパフォーマンスを約10倍向上させ、推論効率を37%向上させることができます。モデルサービスレベルでは、アリババクラウドは中国で最も活発なAIモデルコミュニティであるMoDaを構築し、企業がTongyi Qianwenまたはサードパーティの大規模モデルに基づいて再トレーニングすることをサポートしています。

アリババクラウドは今年7月初旬、中国のビッグモデルエコシステムの繁栄を促進することを主な目標とし、ビッグモデルスタートアップにモデルのトレーニング、推論、展開、微調整、評価、製品化などを含む一連のサービスを提供し、資金と商業化の面で全面的なサポートを提供すると発表しました。

<<:  AIはイノベーションを通じて気候への影響を補うことができるでしょうか?

>>:  国内外のオープンソースモデルを競うLlama-2の初の総合評価

ブログ    

推薦する

データサイエンスに必須の Python パッケージ 10 個

[51CTO.com クイック翻訳] データサイエンスに対する人々の関心は過去 5 年間で大幅に高ま...

教師なし学習のための最も重要な12のアルゴリズムとその使用例

教師なし学習は、教師あり学習とは対照的に、もう 1 つの主流の機械学習方法です。教師なし学習では、デ...

...

アメリカの科学者が新技術を開発:ロボットが行動する前によく考えさせる

カリフォルニア大学バークレー校の新しい研究によると、ロボットはビデオ認識技術を通じて物体を移動させる...

大規模機械学習のためのプログラミング手法、計算モデル、Xgboost および MXNet の事例

[[191977]]現在、機械学習のトレンドは、従来の方法のシンプルなモデル + 少量データ (手動...

TextRankアルゴリズムを使用した自動テキスト要約

【51CTO.com クイック翻訳】1. はじめにテキスト要約は、自然言語処理 (NLP) の分野に...

Python 機械学習でプログラミングスキルを向上させる方法

この記事では、Packt の『Python Machine Learning, 3rd Editio...

...

...

「これまで作られなかった最も重要な機械」アラン・チューリングとチューリングマシン

コンピューティングは、私たちのほとんどが直感的に理解できる馴染みのある概念です。関数 f (x) =...

...

新たな自動運転ランキングが発表

最近、米国の市場調査機関であるナビガントリサーチが、自動運転の競争力に関する新たなランキングを発表し...

AIとデート:機械はどうやって私たちを出会わせてくれるのか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

人工知能が建設業界の様相を変えている

建設業は最も長い歴史を持つ産業の一つであると言えます。結局のところ、人々は数千年前から様々なタイプの...

...