強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

先日、人工知能技術の可能性とそれに対する人々の懸念について語った際、人工知能研究会社OpenAIのCEOサム・アルトマン氏は「 AIは止めることのできない竜巻のように、驚くべきスピードで発展している」と述べた。人工知能がその高度なスピードで世界を変えつつあることが分かる。

年初に人工知能における大規模モデルの流行を経験した後、 2023年10月現在、中国には汎用型大規模モデル(AGI)と垂直型大規模モデルの両方を含む、10億以上のパラメータを持つ大規模モデルを保有するメーカーと大学・研究機関が254社ありました。つまり、数日ごとに中国で新し​​い大型モデルが正式に発表されることになります。

しかし、大規模モデルのインテリジェント化と商業化はそれほど速くないことに気づく実務家が増えています。

ビッグモデル技術の進化とビジネスの実施により、一部の参加者は砂の中の砂のように淘汰され、最終的にはハードコアな技術力とリソースを備えた企業だけが生き残ることができます。

では、現時点で国内にこれほど多くの大型モデルが存在するのは、どのような種類のモデルなのでしょうか?どれが一番強いでしょうか?

ユニバーサル大型モデルと垂直大型モデル、どちらが将来性があるか

中国には一般大型機種や縦型大型機種(特大機種とも呼ばれる)など、80種類近くの大型機種があると言われています。 2つを比較すると、どちらが良いでしょうか?実際、アプリケーションの観点から両方を考慮すると、どちらも独自の特徴を持っています。

汎用大規模モデル(AGI)とは、自然言語処理分野の事前学習済みモデル、画像認識分野の事前学習済みモデルなど、複数の分野や業界に適用可能な大規模モデルを指します。

この大型モデルは、用途が広く、複数の分野で使用できます。よく耳にする人工知能企業OpenAIが開発したChatGPT、アリババのTongyi Qianwen、百度のWenxin Yiyanなどは、いずれも一般的な大規模モデルの代表例です。

垂直型ビッグモデルとは、医療分野のビッグモデル、金融分野のビッグモデル、物流分野のビッグモデルなど、特定の分野や業界向けに開発されたビッグモデルのことです。

たとえば、物流シナリオには多くの文書(物流活動において物流輸送のために発行される法的かつ有効な文書、例えば物流輸送契約文書など)と一貫性のない形式が関係しています。物流ビッグモデルは、標準化された方法でそれらを迅速かつ正確に識別し、構造化されたデータを提供して、エラー修正と完了操作を実行し、その後の運送状の分割、契約の履行と配布、およびその他のリンクの品質と効率を確保できます

このタイプの大型モデルは、より専門的で、特定の分野を対象としており、その分野の特定の問題をよりよく解決できます。そのため、垂直大型モデルは特殊大型モデルとも呼ばれます

それぞれを比較するのは非常に難しいと言えますので、どれが最も将来性が有望であるかを言うことも困難です。

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

一般的な大型モデルと垂直型大型モデルの長所と短所を単一の法則で比較することは不可能ですが、強力な大型モデルが持つ「超能力」は常に共通しており、より広い発展の可能性を秘めています。

1. 超大規模な計算能力

一般的な AI アプリケーションと比較して、大規模モデル アプリケーションのトレーニングと推論には、より強力なコンピューティング パワーのサポートが必要です。コンピューティング パワーが一般的な大規模モデルの収益を決定すると言えます。

中国でクラウドサービスを提供するアリババクラウドやテンセントクラウドは、それ自体が巨大なコンピューティングパワーを持っており、それが彼らが開発する大規模モデルの最大の競争力となっている。

2. 大量のデータ

大規模モデルをトレーニングするには、より大量のデータ、より優れたデータ品質、より多様なデータ ソースが必要です。したがって、誰もが十分な計算能力を持ち、ビッグモデルのアーキテクチャが類似している場合、データ量が多く、データ品質が高いという利点を持つ人は、それに応じてビッグモデルの品質を向上させ、ビッグモデルの適用効果も向上します。

3. オープンソースの大規模モデルである

もう 1 つの考慮事項は、それがオープン ソースの大規模モデルであるかどうかです。ソースコードはオープンなので、ユーザーのニーズに合わせていつでも変更やカスタマイズが可能で、基本的に無料です(無料使用は大規模モデルの利用の敷居を下げます。例えば、海外でのChatGPTや中国のWenxin Yiyanの人気は、まさに使いやすさにあります。誰でも登録するだけで体験できます)。これにより、より多くの開発者やユーザーが参加でき、大規模モデルの品質と安定性を向上させることができます。代表的なオープンソースの大規模モデルとしては、Alibaba の Tongyi Qianwen が挙げられます。

クローズドソースの大規模モデルは開発会社によって保守されています。開発会社は大規模モデルの品質と安定性をコントロールできますが、モデルの機能を継続的に向上させ、長期にわたって揺るぎない優位性を維持できない場合は、オープンソースに置き換えられる可能性があります。したがって、ChatGPT や Wenxin Yiyan などの大規模なクローズドソース モデルでは、強力なパフォーマンスを維持する必要があります。

4. APIインターフェースがあるかどうか

オープン サービス機能は、大規模モデルの機能を評価する上で重要な要素の 1 つです。大規模モデルの API インターフェイスを公開すると、そのオープン性と外部サービス機能が向上します。

オープン API インターフェースは専門家にとって不可欠です。研究者はこれを使ってさまざまなテストを行うことができます。個人の起業家もこのインターフェースを利用して実際のビジネスに応用することができます。

近い将来、大規模モデルが直面している技術的およびコスト的な問題が解決されるにつれて、関連するエンタープライズレベルのアプリケーションやコンシューマーアプリケーションの実装のペースが加速すると考えています。これにより、強力な大規模モデルメーカーとアプリケーションベースの製品のグループも強調され、これらのメーカーと製品は、今日台頭している大規模モデル製品から生まれる可能性が高くなります。

<<:  データセンター: クラウドと AI 導入の鍵となる要素

>>:  シリコンバレーのAI界で注目の記事:ジャスパーとVCはAIGCブームの最大の敗者となり、潮が引いた後に初めて誰が裸で泳いでいるかがわかる

ブログ    
ブログ    
ブログ    

推薦する

Google Brain の公開: アルゴリズムのエラー修正と AI バイアスの解決に重点を置く

テンセントテクノロジーニュース、1月29日、海外メディアの報道によると、グーグルCEOサンダー・ピチ...

GPT-3は創造性に欠けるにもかかわらず、わずか20分で合格できる大学論文を書いた。

GPT-3で書かれた論文は通過したのでしょうか?教育リソースウェブサイトEduRefがこれに関する...

決まりました!国は人工知能に関する重要なニュースを発表し、これらの人々は集団的に失業することになるだろう...

1寝耳に水! 11月15日、国からビッグニュースが発表されました!科学技術部は、新世代人工知能開発...

プロセス自動化の分野をどのように理解すればよいでしょうか?

[51CTO.com クイック翻訳]今日、プロセス自動化にはさまざまな形があります。また、ツールの...

マイクロソフト、Nvidia が 5300 億の NLP モデル「Megatron-Turing」をリリース、価格は A100 で 4480 台

[[428336]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

...

Ruijie NetworksとMidea Smartは戦略的提携を結び、スマート小売端末の商業化と普及に取り組んでいます。

6月30日、瑞傑ネットワークス株式会社(以下、瑞傑ネットワークス)と合肥美的智能科技有限公司(以下...

ニューラル放射フィールドはポイントベースで、NeRFよりも30倍高速なトレーニング速度と優れたレンダリング品質を備えています。

2020 年はボリューメトリック ニューラル レンダリングが爆発的に普及する年です。たとえば、Ne...

売上高2,684億元の背後にあるアリババのAI技術の全貌

先日終了した双十一では、天猫の取引額は2,684億元に達し、前年比25.7%増加した。この成果の裏に...

...

sklearnのトレーニング速度が100倍以上向上、米「Fanli.com」がsk-distフレームワークをオープンソース化

この記事では、Ibotta (「Rebate Network」の米国版) の機械学習およびデータ サ...

データベースは再び削除されましたが、今回はAIによって削除されました

最近、またデータベース削除事件が起こっていると聞きました。しかし、今回はこれまでとは異なります。作業...

2019年のAI業界の再編:疑似AI企業は淘汰される

起業プロジェクトの数、資金調達額、資金調達のスピードなど、AIは近年間違いなく注目の産業です。しかし...

研究機関が新しいレポートでAIの売り手側と買い手側の成功への道筋を定義

調査会社ストラテジー・アナリティクスは新たな報告書の中で、人工知能製品のベンダーとそのユーザーの両方...