「ビッグモデル+」アプリケーションを実装した場合、ビッグモデルの微調整によって、効果、コスト、制御性のバランスをどのように取ることができるでしょうか?

「ビッグモデル+」アプリケーションを実装した場合、ビッグモデルの微調整によって、効果、コスト、制御性のバランスをどのように取ることができるでしょうか?

10月17日、老舗テクノロジー大手の百度が「文心大モデル4.0」を発表し、すでに激動していた百機種戦争が再び白熱した。ますます多くの基本的な大規模モデルの反復速度が高速化するにつれて、「ビッグモデル+」のアプリケーションの転換点が来ています。世界市場を見ると、2030年までにAIGC市場規模は1兆元を超えると予想されており、その巨大な市場潜在力は、さまざまな分野のテクノロジー大手の注目を集め、計画を立てています。

しかし、大多数の企業にとって、本当のチャンスは、ChatGPT のような基本的な大規模モデルをゼロから作成することではなく、一般的な大規模言語モデルに基づいてターゲットを絞った再トレーニング、微調整、評価、展開を実施し、独自のビジネス シナリオに適したアプリケーションを開発することです。しかし、企業はどのように基礎となるデータ リソースを収集し、企業自体に適したモデル ベースを選択し、モデルを微調整すればよいのでしょうか。

今回は、易典天霞で本格的に導入されている「AIカスタマーサービス」を例に、大規模モデルの微調整によって、効果、コスト、制御性のバランスをどうとれるかを見ていきます。

周知のとおり、人工知能技術の急速な発展に伴い、 AIGC はコンテンツ分野に真っ先に参入しており、新たなマーケティングシナリオやマーケティングモデルを開拓する上で、想像力を働かせる余地は膨大にあります。 Yidiantianxia の最新の実践に基づいて、マーケティング分野における AIGC の実装に最適なシナリオは、コンテンツ制作とインテリジェントな質疑応答という 2 つの中核的な側面にあることがわかりました。

コンテンツ制作の面では、易典天下は今年7月に初のAIGCデジタルマーケティング制作プラットフォームKreadoAIを正式にリリースし、マーケティングチェーン全体のコスト削減、品質向上、効率向上に新たな活力と勢いを注入しました。また、インテリジェントな質疑応答の面では、「AIカスタマーサービス」の完全な社内応用を実現しただけでなく、大規模モデルの微調整における参照パスも模索しました。

EasyPointのシニアテクニカルディレクターであるInfi He氏は次のように述べています。「AI時代のインフラストラクチャとして、ビッグモデルの誕生はAIネイティブアプリケーションに前例のない機会を提供し、当社の技術チームに高い要件を突きつけました。特に特定のAIアプリケーション開発シナリオでは、ビッグモデルをうまく活用することが非常に重要です。モデルの事前トレーニングの高コストと長いサイクルと比較して、ビッグモデルの微調整は、制御可能なコストを前提として、期待される結果を迅速に達成できます。」

大規模モデルを微調整する効果には、高品質のデータが不可欠である。

大規模なモデルを微調整する場合、高品質のデータが最も重要です。高品質のデータがなければ、特に対話タスクの場合、コストが限られているという前提で、大規模モデルの SFT 教師あり微調整を行うことは費用対効果が高くありません。LoRA や P-tuning v2 などの現在普及している微調整方法でさえ、データが限られているという前提の下では、ベースモデルの一般的な理解能力が多かれ少なかれ破壊され、明らかな幻覚、対話能力の損傷、壊滅的な忘却などの問題を引き起こします。

高品質なデータを前提として、ベースモデルのパラメータ数が多いほど、微調整効果は高まります。

高いデータ品質を前提として、 Chatglm2-6B、Baichuan2-7B、Baichuan2-13B、LLama2-7B、Qwen-14Bなどの有名なオープンソースの大規模モデルの横画面テストを通じて、ベースモデルのパラメータが大きいほど、微調整効果が向上することがわかりました。ベースモデルが100B(千億)パラメータに達するほど強力になると、1Kの高品質データを使用しても、良好な微調整効果が得られます。

限られたリソースを前提として、強力な一般能力と強力な専門能力を選択する必要があります

データ、 GPU、コストなどのリソースが限られているという前提では、強力な一般機能と強力な専門知識機能を同時に実現することはできず、製品の位置付けに基づいてトレードオフを行う必要があります。モデルに特定の専門分野で強力な専門能力を持たせたい場合は、一般的な能力の一部を犠牲にする必要があるかもしれません。 AI カスタマー サービスを例にとると、企業内部での使用シナリオでは、マーケティングの問題に迅速に対応したい場合は、生活上の問題に関するフィードバックの正確さを犠牲にする必要があります。

現在、Yidiantianxia AIカスタマーサービスは、ベースモデルの強力な微調整効果に頼り、機能、人事、IT、ビジネスなどの日常的な問い合わせシナリオの80%をカバーしています。企業の従業員が問題に遭遇したときはいつでも質問でき、24時間365日AIカスタマーサービスから正確な回答を得ることができます。これにより、企業の内部作業効率が大幅に向上します。

現在、 AIGC波の継続的な発展に伴い、海外マーケティングはクリエイティブコンテンツの制作から配信戦略の自動化、パフォーマンスデータの回復、全体的なトラフィックの最適化まで、新たな世代の飛躍を遂げています。AI技術の継続的な革新により、一滴天下はより深く、より広く、より速く、よりスマートに、海外マーケティング業界全体のクリエイティブエコシステムを再構築しています。次号の「MarTech Hub」では、「データミドルプラットフォーム」というトピックに焦点を当て、DataOps プラクティスをビジネス指標管理に拡張する方法を見ていきます。

<<:  Testin Cloud Testingは、ビッグモデル+ソフトウェアテストの業界リーダーの技術革新の道を模索し始めました。

>>:  スタンフォード大学が主流モデルのトップ10の透明性を公開!ラマ2が1位、GPT-4は透明性がない、ルカン氏が批判:収益性は完全に理解されている

ブログ    
ブログ    

推薦する

...

...

1990年代生まれの中国人教授が、1年間でネイチャー誌に3本の論文を発表した。最初の量子ニューラルネットワークQuantumFlowはオープンソースです

[[432543]]ニューラル ネットワークは、現在のコンピューティング アプリケーションで最も急速...

...

ネイチャー誌の記事で、ウォータールー大学のチームが「量子コンピュータ+大規模言語モデル」の現状と将来についてコメントした。

今日の量子コンピューティング デバイスをシミュレートする際の主な課題は、量子ビット間で発生する複雑な...

AIIAがAIチップベンチマークの第一ラウンドの結果を発表

3月6日、国際電気通信連合と中国情報通信研究院が共催し、人工知能産業発展連盟(AIIA)とZTEが主...

人工知能の時代、主役となるのは誰でしょうか?

[[382357]] 1990年代、米国はコンピュータ産業の早期発展の機会をいち早く捉え、デジタル...

人工知能技術が農業に革命を起こす

国際的に著名な学者である周海中教授は、1990年代に「科学技術の進歩により、人工知能の時代が到来しよ...

あなたのキャリアはAIの影響を受けますか?

[[277927]] [51CTO.com クイック翻訳] 今日、私たちは日常生活や仕事を実現する...

ロボットは人間に取って代わるでしょうか?

人工知能は現在、病気の診断、車の運転、言語の理解、さらにはチェスでトップクラスの人間プレイヤーに勝つ...

...

あなたは知っていますか?注文するテイクアウトはすべて、ディープラーニングとの美しい出会いです

[[196940]]多くの学生は、フードデリバリーはオンラインで注文し、オフラインで配達するビジネス...

...

AIがスマートフォンを制御するようになると、アプリ時代の終焉が近づいているかもしれない

Mobile World Congress 2024 で AI について言及しないわけにはいきません...

パンデミック後、アメリカ人の半数がスマートデバイスの音声制御が不可欠だと考えている

Syntiantが最近実施したユーザー調査によると、COVID-19パンデミックの影響により、アメリ...