企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

GPT-3.5が海外で発売されてからまだ1年も経っていないし、文心易言が国内で発売されてからまだ半年も経っていない。しかし、中国はすでに「100機種の戦い」へと突入している。参加者には大企業と多数のスタートアップ企業が含まれます。しかし、大型モデル市場での競争は熾烈であり、企業ユーザーが「鋭い目」を養わなければ、罠に陥り、プロジェクトが失敗する可能性が高くなります。

文鑫大型モデル、同益千文、盤古大型モデルなど、一部の大手メーカーの大型モデルは、徐々にその差を広げています。 SuperCLUEの最新評価リストによると、Wenxin YiyanはGPT-3.5turboを上回り、GLM-130Bなどの国産大型モデルもリストの上位にランクされています。量的には国産大型モデルが世界で大きな勢力となり、品質面でも最先端のGPT-4に急速に追いついています。

「百式戦争」の背後には、大規模なモデル技術革新が産業のデジタル化を促進し、数兆ドルの市場価値を生み出すという業界の楽観的な見通しがある。現在の視点から見ると、文鑫易言や同益千文に代表される「大手メーカーが生産する」大型モデルは、技術面で優位な立場を占めており、産業エコシステムを構築することで、市場レベルでより多くのプロジェクト協力も獲得している。

なぜ大企業が製造する大型モデルは、スタートアップ企業が製造するモデルよりも高性能で、顧客に人気があるのでしょうか?私の意見では、主な理由は 3 つあります。

まず第一に、大規模モデルは、単なる 1 回限りの取引ではなく、最終的には業界のシナリオに適用されなければなりません。より高い安定性、セキュリティ、信頼性の象徴として、大企業は一般的に AI 技術基盤が十分に蓄積されています。企業顧客はアプリケーションレベルに重点を置く傾向があり、必ずしも基盤となる AI 技術が十分に蓄積されているわけではありません。百度、アリババ、ファーウェイなどの大手企業はすでに実戦でテストされたAI基盤を構築している。一方、スタートアップ企業は技術革新において多くのハイライトと突破口を持っているが、フルスタックAI技術基盤の蓄積と顧客への長期的かつ安定したサービスの観点から、その総合的な能力と耐久性には依然として疑問が残る。

第二に、大企業は大規模モデル技術の反復的な開発に投資する総合的な能力がより強力です。例えば、百度はグループ全体を動員して Wenxin Yiyan を開発しました。最新バージョンの Wenxin Big Model 3.5 では、バージョン 3.0 と比較して推論速度が 17 倍向上し、モデルの有効性が 50% 以上向上しています。対照的に、最も人気のあるスタートアップ企業であるLightyear Awayは、半年も経たないうちにMeituanに「売却」することを選択した。オープンソース技術に基づいて開発された一部の大規模モデルには、基盤となる技術の蓄積と自律的な進化能力が十分に欠けています。

市場調査会社IDCが発表した最新の「2023年AIビッグモデル技術能力評価レポート」によると、百度文心ビッグモデル3.5は「アルゴリズムモデル」と「業界カバレッジ」という2つの主要指標を含む12の指標のうち7つで満点を獲得し、総合スコアで1位となった。2位のアリババ同義ビッグモデルは11の指標のうち6つで満点を獲得し、「サービス能力」で満点を獲得した唯一のメーカーである。

第三に、業界シナリオにおける大規模モデルの実装、それに続くサービスの提供、運用と保守などは、大企業にとっては「簡単」ですが、新興企業にとっては難しい課題です。大企業は、垂直産業や主要顧客向けに専用のサービスチームを提供することができ、顧客が新しいテクノロジーを導入する際の不安を解消することができます。しかし、スタートアップ企業には、政府機関や企業顧客へのサービス提供で蓄積された経験が不足していることが多く、オープンソーステクノロジーに基づいて開発された大規模モデルの製品アプリケーションに対してフルプロセスのサービスを提供することは困難です。

要約すると、ビッグモデルはさまざまな技術的パラメータだけでなく、業界のアプリケーション、業界の「ノウハウ」、および成功した経験にも依存します。技術開発、産業応用、サービスなど、現在、大手メーカーの製品が有利な立場を占めています。もちろん、「百式戦争」は、最終的に勝者が2人しかいなかった10年以上前の「百連隊戦争」とは異なるかもしれない。このビッグモデルはまだ開発の初期段階にあり、GPT-4や欧米の競合製品を上回る可能性など、今後さらなる可能性が開けるだろう。

<<:  Baiduのビジネスマルチモーダル理解とAIGCの革新的な実践

>>:  AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか

ブログ    
ブログ    

推薦する

2030年にAIは人間のためにどんな仕事を創出できるでしょうか?

[[201234]]編集者注: 人工知能は多くの人の仕事を奪うだろう、これはメディアの報道でも事実...

蘇寧電子商取引プラットフォームにおけるAI技術+短編動画の応用

[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...

10年後の市場規模は1.3兆ドル。「モデル電源時代」到来

半年以上にわたる大規模なモデル嵐の後、AIGC 市場には新たな変化が起こり始めました。クールな技術デ...

認知マップの科学的インベントリ: グローバルな第3世代AIの「大きな」機会

近年、人工知能 (AI) は、ディープラーニング、コンピューター ビジョン、自然言語処理などの技術革...

人工知能システム:無制限の核融合反応を現実のものに

近年、研究者らはトカマクの停止や損傷の原因となる核分裂反応を研究している。核分裂反応を予測・制御でき...

モビリティの未来:スマート、持続可能、効率的

[[348989]] COVID-19のロックダウンの緩和により多くの社会的要因が浮き彫りになりまし...

生成型人工知能が経済と社会に与える影響

生成アルゴリズム、事前トレーニング済みモデル、マルチモーダルなどの技術の累積的な統合と反復を経て、人...

...

13 の視覚言語タスクをクリアしましょう!ハルビン工業大学がマルチモーダル大型モデル「九天」をリリース、性能が5%向上

マルチモーダル大規模言語モデルにおける視覚情報抽出が不十分な問題に対処するため、ハルビン工業大学(深...

予測分析の 4 つの業界における用途

[[436125]]画像ソース: https://pixabay.com/images/id-602...

...

「最強の7Bモデル」論文が発表され、ラマ2の13Bバージョンを超える方法が明らかになった

「欧州OpenAI」の「最強の7Bオープンソースモデル」であるMistralは、最近、数え切れないほ...

人工知能技術の応用方向

[[395149]]人工知能を学ぶことで何ができるのでしょうか?詳しくご紹介します。 1. 製造業ス...

...

CIIE 2019 サノフィと朱江知能が共同で医療のデジタル未来を創造

第2回中国国際輸入博覧会が11月10日に成功裏に終了した。医療機器と医薬健康展示エリアでは、世界有数...