スタートアップ企業が大型モデルを商品化することは信頼できるのでしょうか?

スタートアップ企業が大型モデルを商品化することは信頼できるのでしょうか?

昨年末にChatGPTが登場して以来、大規模モデルへの世界的な熱狂が世界を席巻しています。現在、「百式大戦」が本格化しており、中国国内だけでも大型模型の数は100以上あるといわれている。影響を受ける企業には、百度やアリババなどの大手企業のほか、二流三流のテクノロジー企業や多数の新興企業も含まれる。業界が熱意に満ちているのは当然良いことですが、どの技術トラックも「80/20ルール」から逃れることはできません。今後の大型モデルトラックでは、最後に笑う企業はいくつあるでしょうか?

現在までに、多くの大型モデルの「後継」の中で、GPT に匹敵するものはほとんどありません。現実は残酷です。ほとんどの中小企業にとって、大規模モデルの「大きさ」は、計算能力とデータの両面で手の届かないものです。多くの大規模モデルは、むしろ「強がっている」ようなもので、実際には期待されるレベルを満たしていません。

より大きな問題は、ToC から ToB への大規模モデルの移行時に発生します。

データ会社SimilarWebによると、ChatGPTの世界全体のトラフィックは5月から6月にかけて9.7%減少し、米国内のトラフィックは10.3%減少した。 C エンドでの大規模モデルの適用は一時的に限界に達したようで、より多くの「キラー」アプリケーションが必要です。 B 面では、大規模モデルが驚くべき可能性を示しています。最も直接的な現れは、以前のより単純な AI ツールの置き換えです。たとえば、大規模なモデルのサポートにより、インテリジェントな顧客サービスは、以前に比べてインテリジェンス レベルが大幅に向上しました。コード生成、財務上の意思決定、生命科学などの分野でも、大きなモデルは想像力を発揮する大きな可能性を秘めています。

この点に関しては、企業も大きな熱意を示しています。しかし、大規模モデルのトレーニングにはコストがかかることから、大多数の開発者や企業は依然として大規模モデルを選択する必要があります。しかし、Baidu が主張するように、ビッグモデルは IT アーキテクチャに大きな変化をもたらしており、以前の 3 層アーキテクチャから「チップ-フレームワーク-モデル-アプリケーション」の 4 層アーキテクチャへと移行しています。ビッグモデルの選択は、企業がこれまでオペレーティング システムデータベースを選択してきたのと同じくらい重要になっています。

過去の経験に基づくと、これにはメーカーが強力な技術力と、継続的に反復してアップグレードする能力を備えていることが求められます。制御性とコンプライアンスの要件を満たすには、メーカーは強力な総合力を持ち、人的資源と物的資源を長期的かつ安定的に投資できる必要があります

第二に、大手モデルメーカーはチャットボットを提供するだけでなく、企業のニーズに基づいて、使いやすく、完全で、安全で、安定していることが保証されたツールチェーンも提供する必要があります。企業ユーザーのニーズは多様です。ビッグモデルを選択するということは、単に一般的な機能が強力であるということだけではありません。企業はビッグモデルのテクノロジースタックの完全性に注意を払いながら、自社のビジネスに適したメーカーを選択する必要もあります。そのためには、製造業者が産業用アプリケーションで十分な経験を積み、実際のビジネス シナリオにテクノロジーを適用できることが求められます。

スタートアップチームにとって、業界で大規模なモデルを実装するのは明らかに困難です。創業者が比較的業界や技術の深いバックグラウンドを持っていたとしても、スタートアップチームには不確実性が多くあります。成功するかどうかはそれを作る人々次第かもしれませんし、キーとなる人々の離脱により失敗する可能性もあります。今年初め、王慧文の「光年遠」は大型模型の分野でかつて最も輝かしい起業プロジェクトだったが、彼が個人的な健康上の理由で退社したため、「光年遠」も美団に買収され、引き継がれた。

投資コストが高いということは、キャッシュフローの不足によりスタートアップ企業がいつでも倒産する可能性があり、それが企業プロジェクトの失敗につながる可能性があることを意味します。

Meta がビッグモデルLlama 2 をオープンソース化した後、主流のビッグモデルと競合するどころか、多くのビッグモデルのスタートアッププロジェクトが最初から消滅しました。

実際、iFlytekのような二流インターネット企業でさえ、大規模な商業化ができず、主な資金源を融資と借金に頼っているスタートアップ企業は言うまでもなく、深刻な赤字を出し、大規模モデルへの投資を継続できないとして、外部から疑問視されている。

スタートアップチームが追いつくのが最も簡単な唯一の指標である技術レベルに関しても、 SuperCLUEが先日発表した最新の評価リストから、大企業の方が「ハードパワー」の面ではまだ優れていることがわかります。その中で、Baiduの最新バージョンのWenxin Yiyanは、中国分野でGPT -3.5を超えており、主流の海外モデルと競争するのに十分です。

さらに、百度文心大模型、アリババクラウド同益前文、華為盤古大模型など国内トップの大型模型メーカーもToB事業を積極的に拡大している。 IDCはこのほど、「AIビッグモデル技術能力評価レポート2023」を発表し、製品技術、サービス生態、産業応用の3つの側面を中心にビッグモデルの10以上の指標を検討し、百度、アリババ、テンセント、ファーウェイ、iFlytek、360、センスタイムなどのメーカーを含む国内主流のビッグモデル14社を評価した。

その中で、百度文心モデルが総合得点で1位を獲得した。アルゴリズムモデル、サービス能力、エコシステム協力、業界カバレッジなどの面では、主要な主流モデルにはそれぞれ独自の利点があります。

これは間違いなく、大型モデル競争における大手メーカーの絶対的な優位性を反映しています。製品技術と産業応用の面では、第2、第3層の競合他社よりもはるかに優れています。例えば、ランキング1位の文心ビッグモデルは、文心易眼テストへのアクセスを申請した15万社の公式発表を受けています。百度スマートクラウドと300社以上のエコシステムパートナーは、400以上のシナリオで非常に優れたテスト結果を達成し、多くの企業と協力して11の業界ビッグモデルをリリースしました。

ほとんどの大規模モデルの場合、これで開始時点で失敗する可能性があります。しかし、百度、アリババ、ファーウェイにとって、競争はまだ始まったばかりだ。大企業にとって、業界への長期投資と深い育成は単なるスローガンではなく、必ず実行されることだ。

<<: 

>>:  MIT、悪意のあるAI編集から画像を保護する「PhotoGuard」技術を開発

ブログ    
ブログ    

推薦する

深層強化学習について知っておくべきこと

[51CTO.com クイック翻訳] 現在、機械学習(ML)と人工知能(AI)に関連するアルゴリズム...

人工知能は大量失業を引き起こすでしょうか?中国人民政治協商会議全国委員会によるこの調査は、その答えを提供している。

2019年の注目産業よく知られている5G、ブロックチェーン、インターネットに加えてもう一つは人工知...

ドローンはサメに対する私たちの考え方を変えている、と研究で判明

Google で「サメ」と検索すると、サメ​​の目撃情報に関する最近のニュースの見出しがいくつか表示...

...

新素材の画期的な進歩、AIの医療への参入…2021年はどんな新しい技術トレンドを迎えるのでしょうか?

2020年も終わりに近づいていますが、疫病は科学技術の進歩を止めることはなく、量子コンピューティン...

...

不気味な人工知能はいつでもあなたが何を考え、何を見ているかをスパイできる

日本の科学者たちは、驚くほどの正確さで脳内を覗き込むことができる不気味な機械を開発した。この AI ...

...

...

マルチモダリティの最新の動向をご存知ですか?中国科学院自動化研究所は、視覚言語事前訓練に関する最初のレビューを発表した。

機械が人間と同じように反応するようにすることは、AI 研究の永遠の目標でした。機械が知覚し、考える能...

世の中には、ほとんどコードを必要としない強力で古典的なアルゴリズムやプロジェクト事例にはどのようなものがありますか?

今日は、コードが非常に少ないけれども、非常にクールでクラシックな 4 つのアルゴリズムまたはプロジェ...

...

機械学習により暗号通貨は追跡可能になるか?

[[349063]] [51CTO.com 速訳] 機械学習技術を使って仮想通貨を追跡できるのか?...