Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Alibaba Cloudは、Llama2トレーニングの展開を全面的にサポートする最初の企業であり、企業が独自の大規模モデルを迅速に構築できるように支援します。

Llama2 はオープンソースであり、無料の商用利用をサポートしているため、オープンソースの大規模モデルに対する業界の強い注目を集めています。 7 月 25 日、Alibaba Cloud は中国で先陣を切って、Llama2 の全バージョンを対象としたトレーニングおよび展開ソリューションを開始しました。Alibaba Cloud では、すべての開発者が Alibaba Cloud 上で独自の大規模モデルを構築することを歓迎します。

最近、Llama2 大規模言語モデルがオープンソース化され、70 億、130 億、700 億のパラメータを持つバージョンをカバーすることが発表されました。 Llama2 は、月間アクティブ ユーザー数が 7 億人未満の研究シナリオおよび商用シナリオで無料で使用でき、企業や開発者に大規模モデル研究のための新しいツールを提供します。しかし、特にパフォーマンスが優れた大規模バージョンの Llama2 を再トレーニングして展開するには、依然として高い障壁が存在します。

開発者を支援するために、アリババクラウドの機械学習プラットフォームPAIは、中国で初めてLlama2シリーズのモデルを深く適応させ、軽量の微調整、完全なパラメータの微調整、推論サービスなどのシナリオ向けのベストプラクティスソリューションを立ち上げ、開発者がLlama2に基づいて迅速に再トレーニングし、独自の大規模モデルを構築できるように支援しました。

Alibaba Cloud が立ち上げた AI モデル コミュニティである ModelScope が、Llama2シリーズ モデルを初めてリリースしました。開発者は、MoDa コミュニティの Llama2 モデル ページで「ノートブック クイック開発」をクリックすると、Alibaba Cloud 機械学習プラットフォーム PAI をワンクリックで起動し、クラウド上でモデルを開発して展開できます。他のプラットフォームからダウンロードした Llama2 モデルも、Alibaba Cloud PAI を使用して開発できます。

特別なシナリオ要件を満たすために、開発者は多くの場合、微調整トレーニング方法を使用してモデルを「調整」し、特定の分野の専門的な能力と知識を獲得する必要があります。現時点では、PAI は開発者がクラウド上で軽量の Lora 微調整やより詳細なフルパラメータの微調整を実行できるようにサポートしています。モデルの微調整が完了したら、PAI は開発者が Web UI と API を通じて Llama2 を展開できるようにサポートし、モデルが Web ページまたは組み込みアプリケーションを通じてユーザーと対話できるようにします。

Llama2のローカルスタンドアロントレーニングと比較して、超大規模モデルの詳細な開発はAlibaba Cloud上で完了できます。プリセット環境はメンテナンスフリーで操作が簡単です。同時に、開発者は豊富なAIコンピューティングリソースと極めて高い弾力性を得ることができます。ローカルのシングルカード GPU では、Llama2 の 70 億パラメータ バージョンの軽量 Lora 微調整と推論しか実行できません。より大きなバージョンやより深いトレーニングをサポートするのは困難です。 Alibaba Cloud では、PAI Lingjun Intelligent Computing サービスが提供する分散コンピューティング機能により、Llama2 のフルサイズ バージョンの軽量かつ完全なパラメータの微調整が可能になり、効率的な展開と推論が可能になります。

Alibaba Cloud は、世界トップ 3 のクラウド ベンダーの 1 つであり、アジア最大のクラウド ベンダーとして、中国の AI ブームの重要なリーダーおよびサービス プロバイダーであり、完全な IaaS + PaaS + MaaS 統合 AI サービスを構築しています。インフラレベルでは、アリババクラウドは中国最強のインテリジェントコンピューティングパワーの備蓄を保有しています。Lingjun Intelligent Computing Clusterは、最大10万枚のGPUカードの拡張性を備え、数兆個のパラメータを持つ複数の大規模モデルの同時オンライントレーニングをサポートできます。AIプラットフォームレベルでは、アリババクラウドの機械学習プラットフォームPAIが、AI開発プロセス全体にエンジニアリング機能を提供します。PAI Lingjun Intelligent Computingサービスは、Tongyi Qianwenなどの超大規模モデルのトレーニングとアプリケーションをサポートしており、大規模モデルのトレーニングパフォーマンスを約10倍向上させ、推論効率を37%向上させることができます。モデルサービスレベルでは、アリババクラウドは中国で最も活発なAIモデルコミュニティであるMoDaを構築し、企業がTongyi Qianwenまたはサードパーティの大規模モデルに基づいて再トレーニングすることをサポートしています。

アリババクラウドは今年7月初旬、中国のビッグモデルエコシステムの繁栄を促進することを主な目標とし、ビッグモデルスタートアップにモデルのトレーニング、推論、展開、微調整、評価、製品化などを含む一連のサービスを提供し、資金と商業化の面で全面的なサポートを提供すると発表しました。

<<:  AIはイノベーションを通じて気候への影響を補うことができるでしょうか?

>>:  国内外のオープンソースモデルを競うLlama-2の初の総合評価

推薦する

AIの将来にとって人間の関与が重要な理由

人工知能技術の進歩は、自動化と革新の新しい時代の到来を告げるものとなるでしょう。しかし、機械知能の進...

人工知能によって作られた、素晴らしい美しさと能力を持つ美しいロボット

我が国初の自主開発人工知能美容ロボットも誕生しました。その皮膚は先進的なシリコンで作られており、まる...

ChatGPT「ピクチャートーク」が大変身しました!舞台裏で新型GPT-4Vモデルが公開

ChatGPTに音声・画像機能が加わりました! ChatGPT にログインすると、より直感的なインタ...

推奨に値する 7 つの優れたオープンソース AI ライブラリ

[[406029]] [51CTO.com クイック翻訳]人工知能 (AI) 研究の分野では、Ten...

マイクロソフトCEOナデラ氏:私は4つの大きな変革を経験してきたが、AIは5番目だ

マイクロソフトのサティア・ナデラCEOは10月23日、メディアのインタビューで、同社はこれまで4つの...

...

...

...

BLIP-2とInstructBLIPがトップ3にランクイン! 12の主要モデル、16のリスト、「マルチモーダル大規模言語モデル」の総合評価

マルチモーダル大規模言語モデル (MLLM) は、LLM の豊富な知識蓄積と強力な推論および一般化機...

デジタル産業を支援し、インテリジェントな未来をつなぐ――西安航空基地企業「ファーウェイ参入」デジタル変革社長クラス

[51CTO.comからのオリジナル記事]現在、疫病と政治環境の影響により、多くの不確定要素が重なり...

CPP アルゴリズム問題のための共通コンテナ技術

[[413003]]アルゴリズムの問​​題を解決するときに CPP でよく使用されるコンテナ テクニ...

AI はどのようにして人間の会話の内容を認識するのでしょうか?マイクロソフト研究チームがお伝えします

[[280027]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

Boyaのディープラーニング製品がHuman Horizo​​nsの自動運転実現に貢献

ヒューマンホライゾンズテクノロジーズ株式会社は、新エネルギー車、インテリジェントネットワーク、共同交...

スタンフォード大学とOpenAIがメタプロンプティングを提案し、最も強力なゼロショットプロンプティング技術が誕生した。

最新世代の言語モデル (特に GPT-4、PaLM、LLaMa) は、自然言語処理と生成の限界を押し...