GPT-3.5が海外で発売されてからまだ1年も経っていないし、文心易言が国内で発売されてからまだ半年も経っていない。しかし、中国はすでに「100機種の戦い」へと突入している。参加者には大企業と多数のスタートアップ企業が含まれます。しかし、大型モデル市場での競争は熾烈であり、企業ユーザーが「鋭い目」を養わなければ、罠に陥り、プロジェクトが失敗する可能性が高くなります。 文鑫大型モデル、同益千文、盤古大型モデルなど、一部の大手メーカーの大型モデルは、徐々にその差を広げています。 SuperCLUEの最新評価リストによると、Wenxin YiyanはGPT-3.5turboを上回り、GLM-130Bなどの国産大型モデルもリストの上位にランクされています。量的には国産大型モデルが世界で大きな勢力となり、品質面でも最先端のGPT-4に急速に追いついています。 「百式戦争」の背後には、大規模なモデル技術革新が産業のデジタル化を促進し、数兆ドルの市場価値を生み出すという業界の楽観的な見通しがある。現在の視点から見ると、文鑫易言や同益千文に代表される「大手メーカーが生産する」大型モデルは、技術面で優位な立場を占めており、産業エコシステムを構築することで、市場レベルでより多くのプロジェクト協力も獲得している。 なぜ大企業が製造する大型モデルは、スタートアップ企業が製造するモデルよりも高性能で、顧客に人気があるのでしょうか?私の意見では、主な理由は 3 つあります。 まず第一に、大規模モデルは、単なる 1 回限りの取引ではなく、最終的には業界のシナリオに適用されなければなりません。より高い安定性、セキュリティ、信頼性の象徴として、大企業は一般的に AI 技術基盤が十分に蓄積されています。企業顧客はアプリケーションレベルに重点を置く傾向があり、必ずしも基盤となる AI 技術が十分に蓄積されているわけではありません。百度、アリババ、ファーウェイなどの大手企業はすでに実戦でテストされたAI基盤を構築している。一方、スタートアップ企業は技術革新において多くのハイライトと突破口を持っているが、フルスタックAI技術基盤の蓄積と顧客への長期的かつ安定したサービスの観点から、その総合的な能力と耐久性には依然として疑問が残る。 第二に、大企業は大規模モデル技術の反復的な開発に投資する総合的な能力がより強力です。例えば、百度はグループ全体を動員して Wenxin Yiyan を開発しました。最新バージョンの Wenxin Big Model 3.5 では、バージョン 3.0 と比較して推論速度が 17 倍向上し、モデルの有効性が 50% 以上向上しています。対照的に、最も人気のあるスタートアップ企業であるLightyear Awayは、半年も経たないうちにMeituanに「売却」することを選択した。オープンソース技術に基づいて開発された一部の大規模モデルには、基盤となる技術の蓄積と自律的な進化能力が十分に欠けています。 市場調査会社IDCが発表した最新の「2023年AIビッグモデル技術能力評価レポート」によると、百度文心ビッグモデル3.5は「アルゴリズムモデル」と「業界カバレッジ」という2つの主要指標を含む12の指標のうち7つで満点を獲得し、総合スコアで1位となった。2位のアリババ同義ビッグモデルは11の指標のうち6つで満点を獲得し、「サービス能力」で満点を獲得した唯一のメーカーである。 第三に、業界シナリオにおける大規模モデルの実装、それに続くサービスの提供、運用と保守などは、大企業にとっては「簡単」ですが、新興企業にとっては難しい課題です。大企業は、垂直産業や主要顧客向けに専用のサービスチームを提供することができ、顧客が新しいテクノロジーを導入する際の不安を解消することができます。しかし、スタートアップ企業には、政府機関や企業顧客へのサービス提供で蓄積された経験が不足していることが多く、オープンソーステクノロジーに基づいて開発された大規模モデルの製品アプリケーションに対してフルプロセスのサービスを提供することは困難です。 要約すると、ビッグモデルはさまざまな技術的パラメータだけでなく、業界のアプリケーション、業界の「ノウハウ」、および成功した経験にも依存します。技術開発、産業応用、サービスなど、現在、大手メーカーの製品が有利な立場を占めています。もちろん、「百式戦争」は、最終的に勝者が2人しかいなかった10年以上前の「百連隊戦争」とは異なるかもしれない。このビッグモデルはまだ開発の初期段階にあり、GPT-4や欧米の競合製品を上回る可能性など、今後さらなる可能性が開けるだろう。 |
<<: Baiduのビジネスマルチモーダル理解とAIGCの革新的な実践
>>: AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか
[[201234]]編集者注: 人工知能は多くの人の仕事を奪うだろう、これはメディアの報道でも事実...
[51CTO.comより引用] 2018年5月18日〜19日、51CTO主催のグローバルソフトウェア...
半年以上にわたる大規模なモデル嵐の後、AIGC 市場には新たな変化が起こり始めました。クールな技術デ...
近年、人工知能 (AI) は、ディープラーニング、コンピューター ビジョン、自然言語処理などの技術革...
近年、研究者らはトカマクの停止や損傷の原因となる核分裂反応を研究している。核分裂反応を予測・制御でき...
[[348989]] COVID-19のロックダウンの緩和により多くの社会的要因が浮き彫りになりまし...
生成アルゴリズム、事前トレーニング済みモデル、マルチモーダルなどの技術の累積的な統合と反復を経て、人...
マルチモーダル大規模言語モデルにおける視覚情報抽出が不十分な問題に対処するため、ハルビン工業大学(深...
[[436125]]画像ソース: https://pixabay.com/images/id-602...
「欧州OpenAI」の「最強の7Bオープンソースモデル」であるMistralは、最近、数え切れないほ...
[[395149]]人工知能を学ぶことで何ができるのでしょうか?詳しくご紹介します。 1. 製造業ス...
第2回中国国際輸入博覧会が11月10日に成功裏に終了した。医療機器と医薬健康展示エリアでは、世界有数...