企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

企業が大型モデルに「参入」する場合、なぜ大手メーカーによる生産が推奨されるのでしょうか?

GPT-3.5が海外で発売されてからまだ1年も経っていないし、文心易言が国内で発売されてからまだ半年も経っていない。しかし、中国はすでに「100機種の戦い」へと突入している。参加者には大企業と多数のスタートアップ企業が含まれます。しかし、大型モデル市場での競争は熾烈であり、企業ユーザーが「鋭い目」を養わなければ、罠に陥り、プロジェクトが失敗する可能性が高くなります。

文鑫大型モデル、同益千文、盤古大型モデルなど、一部の大手メーカーの大型モデルは、徐々にその差を広げています。 SuperCLUEの最新評価リストによると、Wenxin YiyanはGPT-3.5turboを上回り、GLM-130Bなどの国産大型モデルもリストの上位にランクされています。量的には国産大型モデルが世界で大きな勢力となり、品質面でも最先端のGPT-4に急速に追いついています。

「百式戦争」の背後には、大規模なモデル技術革新が産業のデジタル化を促進し、数兆ドルの市場価値を生み出すという業界の楽観的な見通しがある。現在の視点から見ると、文鑫易言や同益千文に代表される「大手メーカーが生産する」大型モデルは、技術面で優位な立場を占めており、産業エコシステムを構築することで、市場レベルでより多くのプロジェクト協力も獲得している。

なぜ大企業が製造する大型モデルは、スタートアップ企業が製造するモデルよりも高性能で、顧客に人気があるのでしょうか?私の意見では、主な理由は 3 つあります。

まず第一に、大規模モデルは、単なる 1 回限りの取引ではなく、最終的には業界のシナリオに適用されなければなりません。より高い安定性、セキュリティ、信頼性の象徴として、大企業は一般的に AI 技術基盤が十分に蓄積されています。企業顧客はアプリケーションレベルに重点を置く傾向があり、必ずしも基盤となる AI 技術が十分に蓄積されているわけではありません。百度、アリババ、ファーウェイなどの大手企業はすでに実戦でテストされたAI基盤を構築している。一方、スタートアップ企業は技術革新において多くのハイライトと突破口を持っているが、フルスタックAI技術基盤の蓄積と顧客への長期的かつ安定したサービスの観点から、その総合的な能力と耐久性には依然として疑問が残る。

第二に、大企業は大規模モデル技術の反復的な開発に投資する総合的な能力がより強力です。例えば、百度はグループ全体を動員して Wenxin Yiyan を開発しました。最新バージョンの Wenxin Big Model 3.5 では、バージョン 3.0 と比較して推論速度が 17 倍向上し、モデルの有効性が 50% 以上向上しています。対照的に、最も人気のあるスタートアップ企業であるLightyear Awayは、半年も経たないうちにMeituanに「売却」することを選択した。オープンソース技術に基づいて開発された一部の大規模モデルには、基盤となる技術の蓄積と自律的な進化能力が十分に欠けています。

市場調査会社IDCが発表した最新の「2023年AIビッグモデル技術能力評価レポート」によると、百度文心ビッグモデル3.5は「アルゴリズムモデル」と「業界カバレッジ」という2つの主要指標を含む12の指標のうち7つで満点を獲得し、総合スコアで1位となった。2位のアリババ同義ビッグモデルは11の指標のうち6つで満点を獲得し、「サービス能力」で満点を獲得した唯一のメーカーである。

第三に、業界シナリオにおける大規模モデルの実装、それに続くサービスの提供、運用と保守などは、大企業にとっては「簡単」ですが、新興企業にとっては難しい課題です。大企業は、垂直産業や主要顧客向けに専用のサービスチームを提供することができ、顧客が新しいテクノロジーを導入する際の不安を解消することができます。しかし、スタートアップ企業には、政府機関や企業顧客へのサービス提供で蓄積された経験が不足していることが多く、オープンソーステクノロジーに基づいて開発された大規模モデルの製品アプリケーションに対してフルプロセスのサービスを提供することは困難です。

要約すると、ビッグモデルはさまざまな技術的パラメータだけでなく、業界のアプリケーション、業界の「ノウハウ」、および成功した経験にも依存します。技術開発、産業応用、サービスなど、現在、大手メーカーの製品が有利な立場を占めています。もちろん、「百式戦争」は、最終的に勝者が2人しかいなかった10年以上前の「百連隊戦争」とは異なるかもしれない。このビッグモデルはまだ開発の初期段階にあり、GPT-4や欧米の競合製品を上回る可能性など、今後さらなる可能性が開けるだろう。

<<:  Baiduのビジネスマルチモーダル理解とAIGCの革新的な実践

>>:  AI企業がソフトウェアサプライチェーンの脆弱性の犠牲になると何が起こるか

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Redis のソースコードを読んで、キャッシュ除去アルゴリズム W-TinyLFU を学びましょう

[[433812]]この記事は董澤潤氏が執筆したWeChat公開アカウント「董澤潤の技術ノート」から...

Pythonでシンプルだが強力な顔認識システムを書く

face_recognition は、強力でシンプル、使いやすい顔認識オープンソース プロジェクトで...

研究室から生活まで、人工知能はどこまで進化しているのでしょうか?

[[212805]]人工知能の概念は1956年に初めて提唱されました。60年間の浮き沈みを経て、人...

小中学生の安全を守るためにロボットは今や欠かせない存在です!

安全性について話すと、誰もが必ずそれに共感します。時代の急速な発展に伴い、人々の個人的な安全がますま...

機械学習実践体験: データプラットフォームの設計と構築

近年人気の技術である機械学習は、数多くの「人工知能」製品でよく知られているだけでなく、従来のインター...

コンピュータビジョンにおけるステレオビジョンと奥行き知覚の例

人工知能と画像処理の魅力的な世界では、これらの概念は、機械が人間の目と同じように私たちの周りの三次元...

これは人工ニューラルネットワークの非常に簡単な説明です

[[419321]]導入私は機械学習についてはよく知りませんが、先月、GitHub で Go のサン...

AIツールは企業にデータ侵害のリスクをもたらす

2021年以降、企業内部者によるデータ侵害、損失、盗難は月平均28%増加しており、回答者の85%は今...

「世界AI人材追跡調査」:米国の上級AI研究者の29%は中国出身。人材を追放することは自らの道を断つことに等しい

中国は世界最大の人工知能研究者の供給国となった。米国の人工知能分野のトップ研究者のほぼ3分の1は中国...

ブックマークにおける不正行為の特定におけるグラフィカル モデルの応用

概要グラフィカル モデルは通常、問題自体に複数の相互に関連する変数があるシナリオで使用され、これらの...

マインドタイピングがネイチャーの表紙に登場! 99%以上の正確さで1分間に90文字を書く

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

マルチエージェント強化学習アルゴリズムが機能しないと聞きました。 MAPPOを正しく使用しましたか?

清華大学とカリフォルニア大学バークレー校の共同研究により、アルゴリズムやネットワークアーキテクチャに...

英国、今年末までに無人運転車の公道走行を許可へ

4月29日、外国メディアの報道によると、英国運輸省は水曜日、自動車線維持システム(ALK)を搭載した...

2023年の5つの主要なテクノロジートレンド

技術の進歩は、驚くべき速さでビジネスモデルを破壊する可能性があります。したがって、ビジネスリーダーに...