「ビッグモデル+」アプリケーションを実装した場合、ビッグモデルの微調整によって、効果、コスト、制御性のバランスをどのように取ることができるでしょうか?

「ビッグモデル+」アプリケーションを実装した場合、ビッグモデルの微調整によって、効果、コスト、制御性のバランスをどのように取ることができるでしょうか?

10月17日、老舗テクノロジー大手の百度が「文心大モデル4.0」を発表し、すでに激動していた百機種戦争が再び白熱した。ますます多くの基本的な大規模モデルの反復速度が高速化するにつれて、「ビッグモデル+」のアプリケーションの転換点が来ています。世界市場を見ると、2030年までにAIGC市場規模は1兆元を超えると予想されており、その巨大な市場潜在力は、さまざまな分野のテクノロジー大手の注目を集め、計画を立てています。

しかし、大多数の企業にとって、本当のチャンスは、ChatGPT のような基本的な大規模モデルをゼロから作成することではなく、一般的な大規模言語モデルに基づいてターゲットを絞った再トレーニング、微調整、評価、展開を実施し、独自のビジネス シナリオに適したアプリケーションを開発することです。しかし、企業はどのように基礎となるデータ リソースを収集し、企業自体に適したモデル ベースを選択し、モデルを微調整すればよいのでしょうか。

今回は、易典天霞で本格的に導入されている「AIカスタマーサービス」を例に、大規模モデルの微調整によって、効果、コスト、制御性のバランスをどうとれるかを見ていきます。

周知のとおり、人工知能技術の急速な発展に伴い、 AIGC はコンテンツ分野に真っ先に参入しており、新たなマーケティングシナリオやマーケティングモデルを開拓する上で、想像力を働かせる余地は膨大にあります。 Yidiantianxia の最新の実践に基づいて、マーケティング分野における AIGC の実装に最適なシナリオは、コンテンツ制作とインテリジェントな質疑応答という 2 つの中核的な側面にあることがわかりました。

コンテンツ制作の面では、易典天下は今年7月に初のAIGCデジタルマーケティング制作プラットフォームKreadoAIを正式にリリースし、マーケティングチェーン全体のコスト削減、品質向上、効率向上に新たな活力と勢いを注入しました。また、インテリジェントな質疑応答の面では、「AIカスタマーサービス」の完全な社内応用を実現しただけでなく、大規模モデルの微調整における参照パスも模索しました。

EasyPointのシニアテクニカルディレクターであるInfi He氏は次のように述べています。「AI時代のインフラストラクチャとして、ビッグモデルの誕生はAIネイティブアプリケーションに前例のない機会を提供し、当社の技術チームに高い要件を突きつけました。特に特定のAIアプリケーション開発シナリオでは、ビッグモデルをうまく活用することが非常に重要です。モデルの事前トレーニングの高コストと長いサイクルと比較して、ビッグモデルの微調整は、制御可能なコストを前提として、期待される結果を迅速に達成できます。」

大規模モデルを微調整する効果には、高品質のデータが不可欠である。

大規模なモデルを微調整する場合、高品質のデータが最も重要です。高品質のデータがなければ、特に対話タスクの場合、コストが限られているという前提で、大規模モデルの SFT 教師あり微調整を行うことは費用対効果が高くありません。LoRA や P-tuning v2 などの現在普及している微調整方法でさえ、データが限られているという前提の下では、ベースモデルの一般的な理解能力が多かれ少なかれ破壊され、明らかな幻覚、対話能力の損傷、壊滅的な忘却などの問題を引き起こします。

高品質なデータを前提として、ベースモデルのパラメータ数が多いほど、微調整効果は高まります。

高いデータ品質を前提として、 Chatglm2-6B、Baichuan2-7B、Baichuan2-13B、LLama2-7B、Qwen-14Bなどの有名なオープンソースの大規模モデルの横画面テストを通じて、ベースモデルのパラメータが大きいほど、微調整効果が向上することがわかりました。ベースモデルが100B(千億)パラメータに達するほど強力になると、1Kの高品質データを使用しても、良好な微調整効果が得られます。

限られたリソースを前提として、強力な一般能力と強力な専門能力を選択する必要があります

データ、 GPU、コストなどのリソースが限られているという前提では、強力な一般機能と強力な専門知識機能を同時に実現することはできず、製品の位置付けに基づいてトレードオフを行う必要があります。モデルに特定の専門分野で強力な専門能力を持たせたい場合は、一般的な能力の一部を犠牲にする必要があるかもしれません。 AI カスタマー サービスを例にとると、企業内部での使用シナリオでは、マーケティングの問題に迅速に対応したい場合は、生活上の問題に関するフィードバックの正確さを犠牲にする必要があります。

現在、Yidiantianxia AIカスタマーサービスは、ベースモデルの強力な微調整効果に頼り、機能、人事、IT、ビジネスなどの日常的な問い合わせシナリオの80%をカバーしています。企業の従業員が問題に遭遇したときはいつでも質問でき、24時間365日AIカスタマーサービスから正確な回答を得ることができます。これにより、企業の内部作業効率が大幅に向上します。

現在、 AIGC波の継続的な発展に伴い、海外マーケティングはクリエイティブコンテンツの制作から配信戦略の自動化、パフォーマンスデータの回復、全体的なトラフィックの最適化まで、新たな世代の飛躍を遂げています。AI技術の継続的な革新により、一滴天下はより深く、より広く、より速く、よりスマートに、海外マーケティング業界全体のクリエイティブエコシステムを再構築しています。次号の「MarTech Hub」では、「データミドルプラットフォーム」というトピックに焦点を当て、DataOps プラクティスをビジネス指標管理に拡張する方法を見ていきます。

<<:  Testin Cloud Testingは、ビッグモデル+ソフトウェアテストの業界リーダーの技術革新の道を模索し始めました。

>>:  スタンフォード大学が主流モデルのトップ10の透明性を公開!ラマ2が1位、GPT-4は透明性がない、ルカン氏が批判:収益性は完全に理解されている

ブログ    
ブログ    

推薦する

Fudan DISC、クロスビジュアル言語モダリティ事前トレーニングモデルMVPTRを発表

復旦大学データインテリジェンスおよびソーシャルコンピューティング研究所復旦大学のデータインテリジェン...

AIはハリウッドに影響を与えているのでしょうか?議論の余地はあるものの、答えはすでにある

最新の3Dアニメーションをご覧になった方は、その壮大な世界に衝撃を受けるかもしれません。もしこれらの...

推論コストが48分の1に削減されました! 1つのGPUで静止画像を動かすことができる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIビッグモデルがついにデータ争奪戦に参戦

現在、ビッグモデルは産業実装の初期段階にあり、高品質のデータはビッグモデルの産業化における重要な要素...

...

1 つのバグが原因で 200 億ドルの損失が発生しました。ビジネス異常検出システムを構築するにはどうすればよいでしょうか?

【51CTO.comオリジナル記事】 1. AI ビジネス異常検出システムが必要な理由企業は、業務...

...

研究:ChatGPTが提供するがん治療オプションには誤った情報が満載

8月27日、OpenAIのチャットボットChatGPTは世界中で人気となっているものの、重要な分野...

本物そっくりの「人工顔」は顔認識を騙せるのか?

[[360561]]過去数年間に自分の写真をオンラインに投稿したことがあれば、Clearview ...

2020 年の生体認証市場 - パンデミックによる業界の動向の変化

生体認証技術市場は、COVID-19の流行により大きな影響を受けるでしょう。 接触のみの生体認証を採...

6000 以上の Web ページを閲覧した後、個人使用に最適な AI 製品のリストを選択しました。

[[220539]]リアム・ヘーネル編集者: Chaoxi、Yuanyuan、Harryこの記事で...

...

Google、AIの地位強化のためデータサイエンスコミュニティKaggleの買収を発表

Google は本日、データサイエンスと機械学習のコンテストを主催するオンライン サービスである K...

アマゾンが注文梱包ロボットを導入、数千人の従業員が職を失う可能性も

アマゾンの従業員2人によると、同社は近年、いくつかの倉庫で数々の新技術を導入し始めており、その中には...

救急室のAIにはもう少し人間的なケアが必要

[[228274]]交換室の電話が鳴り、看護師が手際よく緊急電話に出た。その後すぐに病院は救急車を派...