Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Llama2 はオープンソースであり、無料の商用利用をサポートしているため、オープンソースの大規模モデルに対する業界の強い注目を集めています。 7 月 25 日、Alibaba Cloud は中国で先陣を切って、Llama2 の全バージョンを対象としたトレーニングおよび展開ソリューションを開始しました。Alibaba Cloud では、すべての開発者が Alibaba Cloud 上で独自の大規模モデルを構築することを歓迎します。

最近、Llama2 大規模言語モデルがオープンソース化され、70 億、130 億、700 億のパラメータを持つバージョンをカバーすることが発表されました。 Llama2 は、月間アクティブ ユーザー数が 7 億人未満の研究シナリオおよび商用シナリオで無料で使用でき、企業や開発者に大規模モデル研究のための新しいツールを提供します。しかし、特にパフォーマンスが優れた大規模バージョンの Llama2 を再トレーニングして展開するには、依然として高い障壁が存在します。

開発者を支援するために、アリババクラウドの機械学習プラットフォームPAIは、中国で初めてLlama2シリーズのモデルを深く適応させ、軽量の微調整、完全なパラメータの微調整、推論サービスなどのシナリオ向けのベストプラクティスソリューションを立ち上げ、開発者がLlama2に基づいて迅速に再トレーニングし、独自の大規模モデルを構築できるように支援しました。

Alibaba Cloud が立ち上げた AI モデル コミュニティである ModelScope が、Llama2シリーズ モデルを初めてリリースしました。開発者は、MoDa コミュニティの Llama2 モデル ページで「ノートブック クイック開発」をクリックすると、Alibaba Cloud 機械学習プラットフォーム PAI をワンクリックで起動し、クラウド上でモデルを開発して展開できます。他のプラットフォームからダウンロードした Llama2 モデルも、Alibaba Cloud PAI を使用して開発できます。

特別なシナリオ要件を満たすために、開発者は多くの場合、微調整トレーニング方法を使用してモデルを「調整」し、特定の分野の専門的な能力と知識を獲得する必要があります。現時点では、PAI は開発者がクラウド上で軽量の Lora 微調整やより詳細なフルパラメータの微調整を実行できるようにサポートしています。モデルの微調整が完了したら、PAI は開発者が Web UI と API を通じて Llama2 を展開できるようにサポートし、モデルが Web ページまたは組み込みアプリケーションを通じてユーザーと対話できるようにします。

Llama2のローカルスタンドアロントレーニングと比較して、超大規模モデルの詳細な開発はAlibaba Cloud上で完了できます。プリセット環境はメンテナンスフリーで操作が簡単です。同時に、開発者は豊富なAIコンピューティングリソースと極めて高い弾力性を得ることができます。ローカルのシングルカード GPU では、Llama2 の 70 億パラメータ バージョンの軽量 Lora 微調整と推論しか実行できません。より大きなバージョンやより深いトレーニングをサポートするのは困難です。 Alibaba Cloud では、PAI Lingjun Intelligent Computing サービスが提供する分散コンピューティング機能により、Llama2 のフルサイズ バージョンの軽量かつ完全なパラメータの微調整が可能になり、効率的な展開と推論が可能になります。

Alibaba Cloud は、世界トップ 3 のクラウド ベンダーの 1 つであり、アジア最大のクラウド ベンダーとして、中国の AI ブームの重要なリーダーおよびサービス プロバイダーであり、完全な IaaS + PaaS + MaaS 統合 AI サービスを構築しています。インフラレベルでは、アリババクラウドは中国最強のインテリジェントコンピューティングパワーの備蓄を保有しています。Lingjun Intelligent Computing Clusterは、最大10万枚のGPUカードの拡張性を備え、数兆個のパラメータを持つ複数の大規模モデルの同時オンライントレーニングをサポートできます。AIプラットフォームレベルでは、アリババクラウドの機械学習プラットフォームPAIが、AI開発プロセス全体にエンジニアリング機能を提供します。PAI Lingjun Intelligent Computingサービスは、Tongyi Qianwenなどの超大規模モデルのトレーニングとアプリケーションをサポートしており、大規模モデルのトレーニングパフォーマンスを約10倍向上させ、推論効率を37%向上させることができます。モデルサービスレベルでは、アリババクラウドは中国で最も活発なAIモデルコミュニティであるMoDaを構築し、企業がTongyi Qianwenまたはサードパーティの大規模モデルに基づいて再トレーニングすることをサポートしています。

アリババクラウドは今年7月初旬、中国のビッグモデルエコシステムの繁栄を促進することを主な目標とし、ビッグモデルスタートアップにモデルのトレーニング、推論、展開、微調整、評価、製品化などを含む一連のサービスを提供し、資金と商業化の面で全面的なサポートを提供すると発表しました。

<<:  AIはイノベーションを通じて気候への影響を補うことができるでしょうか?

>>:  国内外のオープンソースモデルを競うLlama-2の初の総合評価

ブログ    
ブログ    

推薦する

...

...

機械学習、データサイエンス、人工知能、ディープラーニング、統計などの違い。

データ サイエンスは幅広い分野であるため、まずはあらゆるビジネスで遭遇する可能性のあるデータ サイエ...

遺伝的アルゴリズムの動作原理を 1 つの記事で理解する (Python 実装付き)

最近、「遺伝的アルゴリズムの紹介とデータ サイエンスにおけるその応用」というタイトルの記事が Ana...

あなたの顔データはどこに保存されますか?

AI顔変換ソフト「ZAO」やMegviiのキャンパス顔認識をめぐる論争に続き、17万件の顔データが...

...

...

マイクロソフトが第1四半期の業績報告を発表: AIサービスの需要が事業成長を牽引

マイクロソフトは10月25日、2024年第1四半期の財務報告を発表した。AI製品とクラウド事業の成長...

Google、AIコードエディタIDXをリリース:クラウド仮想マシンで開発環境の構成を簡素化

Googleは8月9日、「Project IDX」プロジェクトを公開し、AI技術を統合したコードエデ...

強風にも耐えられるドローン?カリフォルニア工科大学は12分間の飛行データを使い、ドローンに風の中での飛行を教える

傘が吹き飛ばされるほど風が強いときでも、ドローンは次のように安定した状態を保ちます。風に乗ることは、...

無人タクシーが登場します。準備はできていますか?

[[243616]]地図: 小魚クラウド コンピューティングやビッグ データなどのアプリケーション...

ChatGPTの曖昧な問題への対応力を高める方法についてお話ししましょう

ヒント エンジニアリング技術は、大規模な言語モデルが検索強化型生成システムで代名詞などの複雑なコア参...

...

未来のあなたは「透明」です!コンピューターは人間の脳信号から思考を予測し、最大83%の精度で人間の脳画像を復元します。

最近、ヘルシンキ大学の研究者らは、脳信号を監視することでコンピューターが視覚知覚をシミュレートできる...

...