スタートアップ企業が大型モデルを商品化することは信頼できるのでしょうか?

スタートアップ企業が大型モデルを商品化することは信頼できるのでしょうか?

昨年末にChatGPTが登場して以来、大規模モデルへの世界的な熱狂が世界を席巻しています。現在、「百式大戦」が本格化しており、中国国内だけでも大型模型の数は100以上あるといわれている。影響を受ける企業には、百度やアリババなどの大手企業のほか、二流三流のテクノロジー企業や多数の新興企業も含まれる。業界が熱意に満ちているのは当然良いことですが、どの技術トラックも「80/20ルール」から逃れることはできません。今後の大型モデルトラックでは、最後に笑う企業はいくつあるでしょうか?

現在までに、多くの大型モデルの「後継」の中で、GPT に匹敵するものはほとんどありません。現実は残酷です。ほとんどの中小企業にとって、大規模モデルの「大きさ」は、計算能力とデータの両面で手の届かないものです。多くの大規模モデルは、むしろ「強がっている」ようなもので、実際には期待されるレベルを満たしていません。

より大きな問題は、ToC から ToB への大規模モデルの移行時に発生します。

データ会社SimilarWebによると、ChatGPTの世界全体のトラフィックは5月から6月にかけて9.7%減少し、米国内のトラフィックは10.3%減少した。 C エンドでの大規模モデルの適用は一時的に限界に達したようで、より多くの「キラー」アプリケーションが必要です。 B 面では、大規模モデルが驚くべき可能性を示しています。最も直接的な現れは、以前のより単純な AI ツールの置き換えです。たとえば、大規模なモデルのサポートにより、インテリジェントな顧客サービスは、以前に比べてインテリジェンス レベルが大幅に向上しました。コード生成、財務上の意思決定、生命科学などの分野でも、大きなモデルは想像力を発揮する大きな可能性を秘めています。

この点に関しては、企業も大きな熱意を示しています。しかし、大規模モデルのトレーニングにはコストがかかることから、大多数の開発者や企業は依然として大規模モデルを選択する必要があります。しかし、Baidu が主張するように、ビッグモデルは IT アーキテクチャに大きな変化をもたらしており、以前の 3 層アーキテクチャから「チップ-フレームワーク-モデル-アプリケーション」の 4 層アーキテクチャへと移行しています。ビッグモデルの選択は、企業がこれまでオペレーティング システムデータベースを選択してきたのと同じくらい重要になっています。

過去の経験に基づくと、これにはメーカーが強力な技術力と、継続的に反復してアップグレードする能力を備えていることが求められます。制御性とコンプライアンスの要件を満たすには、メーカーは強力な総合力を持ち、人的資源と物的資源を長期的かつ安定的に投資できる必要があります

第二に、大手モデルメーカーはチャットボットを提供するだけでなく、企業のニーズに基づいて、使いやすく、完全で、安全で、安定していることが保証されたツールチェーンも提供する必要があります。企業ユーザーのニーズは多様です。ビッグモデルを選択するということは、単に一般的な機能が強力であるということだけではありません。企業はビッグモデルのテクノロジースタックの完全性に注意を払いながら、自社のビジネスに適したメーカーを選択する必要もあります。そのためには、製造業者が産業用アプリケーションで十分な経験を積み、実際のビジネス シナリオにテクノロジーを適用できることが求められます。

スタートアップチームにとって、業界で大規模なモデルを実装するのは明らかに困難です。創業者が比較的業界や技術の深いバックグラウンドを持っていたとしても、スタートアップチームには不確実性が多くあります。成功するかどうかはそれを作る人々次第かもしれませんし、キーとなる人々の離脱により失敗する可能性もあります。今年初め、王慧文の「光年遠」は大型模型の分野でかつて最も輝かしい起業プロジェクトだったが、彼が個人的な健康上の理由で退社したため、「光年遠」も美団に買収され、引き継がれた。

投資コストが高いということは、キャッシュフローの不足によりスタートアップ企業がいつでも倒産する可能性があり、それが企業プロジェクトの失敗につながる可能性があることを意味します。

Meta がビッグモデルLlama 2 をオープンソース化した後、主流のビッグモデルと競合するどころか、多くのビッグモデルのスタートアッププロジェクトが最初から消滅しました。

実際、iFlytekのような二流インターネット企業でさえ、大規模な商業化ができず、主な資金源を融資と借金に頼っているスタートアップ企業は言うまでもなく、深刻な赤字を出し、大規模モデルへの投資を継続できないとして、外部から疑問視されている。

スタートアップチームが追いつくのが最も簡単な唯一の指標である技術レベルに関しても、 SuperCLUEが先日発表した最新の評価リストから、大企業の方が「ハードパワー」の面ではまだ優れていることがわかります。その中で、Baiduの最新バージョンのWenxin Yiyanは、中国分野でGPT -3.5を超えており、主流の海外モデルと競争するのに十分です。

さらに、百度文心大模型、アリババクラウド同益前文、華為盤古大模型など国内トップの大型模型メーカーもToB事業を積極的に拡大している。 IDCはこのほど、「AIビッグモデル技術能力評価レポート2023」を発表し、製品技術、サービス生態、産業応用の3つの側面を中心にビッグモデルの10以上の指標を検討し、百度、アリババ、テンセント、ファーウェイ、iFlytek、360、センスタイムなどのメーカーを含む国内主流のビッグモデル14社を評価した。

その中で、百度文心モデルが総合得点で1位を獲得した。アルゴリズムモデル、サービス能力、エコシステム協力、業界カバレッジなどの面では、主要な主流モデルにはそれぞれ独自の利点があります。

これは間違いなく、大型モデル競争における大手メーカーの絶対的な優位性を反映しています。製品技術と産業応用の面では、第2、第3層の競合他社よりもはるかに優れています。例えば、ランキング1位の文心ビッグモデルは、文心易眼テストへのアクセスを申請した15万社の公式発表を受けています。百度スマートクラウドと300社以上のエコシステムパートナーは、400以上のシナリオで非常に優れたテスト結果を達成し、多くの企業と協力して11の業界ビッグモデルをリリースしました。

ほとんどの大規模モデルの場合、これで開始時点で失敗する可能性があります。しかし、百度、アリババ、ファーウェイにとって、競争はまだ始まったばかりだ。大企業にとって、業界への長期投資と深い育成は単なるスローガンではなく、必ず実行されることだ。

<<: 

>>:  MIT、悪意のあるAI編集から画像を保護する「PhotoGuard」技術を開発

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

ディープ ニューラル ネットワークを構築するための 20 の「未熟な」ヒント

当社の機械学習ラボでは、数多くの高性能マシンで何万時間ものトレーニングを行って豊富な経験を蓄積してき...

AIは小売市場の衰退を防ぐことができるか?

デジタル時代の到来により、私たちの生活は急速に変化しました。買い物の仕方も、近所のショッピングモール...

ワンクリックで動画をアニメーションに変換できるAIツールが人気。様々な格闘技の動きをスムーズに変換でき、無料でオンラインでプレイできます。

テキスト、画像、ビデオ、すべてをアニメーション化できます。見てください、ほんの少し前まで二人の男が格...

3nmなのに歯磨き粉を絞ってるだけ? A17 Proの実行スコアが公開:CPUマルチコアはわずか3.6%向上

昨日Apple A17 Proが正式リリースされ、3nmプロセスを採用していますが、その性能はどのよ...

ベクトルデータベースは AI をどのように改善するのでしょうか?

翻訳者 |ブガッティレビュー | Chonglou事前トレーニング済みのAIモデルがすぐに利用できる...

大規模モデル幻覚率ランキング:GPT-4は3%と最も低いが、Google Palmは最大27.2%

人工知能は急速に発展していますが、問題も頻繁に発生しています。 OpenAI の新しい GPT ビジ...

Alimama は曲率空間学習フレームワークと連合学習ソリューションをオープンソース化し、共通の進歩のために AI 技術を一般に公開します。

9月15日、Alimamaは、曲率空間学習フレームワークと連合学習ソリューションという2つのAI技...

ついにAI、BI、ビッグデータ、データサイエンスをわかりやすく説明する人が出てきた

[[427319]] 01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物...

人工知能と人間の知能のギャップは何でしょうか?

AlphaGoがイ・セドルを破った後、人類の知能の最後の高みも人工知能によって征服されたと誰もが言...

データがあなたを監視することに抵抗はありませんか?

AI 技術の発展と影響に関する最近の調査、研究、予測、その他の定量的評価により、消費者はデータのプ...

...

最大速度アップは20億倍! AIが物理シミュレーションエンジンに革命を起こす

[[422090]]オックスフォード大学の研究によると、機械学習モデルは従来の物理ソルバーに比べて物...

7億7千万パラメータ、5400億PaLMを超えます! UW Google はトレーニング データの 80% のみを必要とする「ステップ蒸留」を提案 | ACL 2023

大規模言語モデルは優れたパフォーマンスを持ち、ゼロショットまたは少数ショットのプロンプトで新しいタス...