強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

先日、人工知能技術の可能性とそれに対する人々の懸念について語った際、人工知能研究会社OpenAIのCEOサム・アルトマン氏は「 AIは止めることのできない竜巻のように、驚くべきスピードで発展している」と述べた。人工知能がその高度なスピードで世界を変えつつあることが分かる。

年初に人工知能における大規模モデルの流行を経験した後、 2023年10月現在、中国には汎用型大規模モデル(AGI)と垂直型大規模モデルの両方を含む、10億以上のパラメータを持つ大規模モデルを保有するメーカーと大学・研究機関が254社ありました。つまり、数日ごとに中国で新し​​い大型モデルが正式に発表されることになります。

しかし、大規模モデルのインテリジェント化と商業化はそれほど速くないことに気づく実務家が増えています。

ビッグモデル技術の進化とビジネスの実施により、一部の参加者は砂の中の砂のように淘汰され、最終的にはハードコアな技術力とリソースを備えた企業だけが生き残ることができます。

では、現時点で国内にこれほど多くの大型モデルが存在するのは、どのような種類のモデルなのでしょうか?どれが一番強いでしょうか?

ユニバーサル大型モデルと垂直大型モデル、どちらが将来性があるか

中国には一般大型機種や縦型大型機種(特大機種とも呼ばれる)など、80種類近くの大型機種があると言われています。 2つを比較すると、どちらが良いでしょうか?実際、アプリケーションの観点から両方を考慮すると、どちらも独自の特徴を持っています。

汎用大規模モデル(AGI)とは、自然言語処理分野の事前学習済みモデル、画像認識分野の事前学習済みモデルなど、複数の分野や業界に適用可能な大規模モデルを指します。

この大型モデルは、用途が広く、複数の分野で使用できます。よく耳にする人工知能企業OpenAIが開発したChatGPT、アリババのTongyi Qianwen、百度のWenxin Yiyanなどは、いずれも一般的な大規模モデルの代表例です。

垂直型ビッグモデルとは、医療分野のビッグモデル、金融分野のビッグモデル、物流分野のビッグモデルなど、特定の分野や業界向けに開発されたビッグモデルのことです。

たとえば、物流シナリオには多くの文書(物流活動において物流輸送のために発行される法的かつ有効な文書、例えば物流輸送契約文書など)と一貫性のない形式が関係しています。物流ビッグモデルは、標準化された方法でそれらを迅速かつ正確に識別し、構造化されたデータを提供して、エラー修正と完了操作を実行し、その後の運送状の分割、契約の履行と配布、およびその他のリンクの品質と効率を確保できます

このタイプの大型モデルは、より専門的で、特定の分野を対象としており、その分野の特定の問題をよりよく解決できます。そのため、垂直大型モデルは特殊大型モデルとも呼ばれます

それぞれを比較するのは非常に難しいと言えますので、どれが最も将来性が有望であるかを言うことも困難です。

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

一般的な大型モデルと垂直型大型モデルの長所と短所を単一の法則で比較することは不可能ですが、強力な大型モデルが持つ「超能力」は常に共通しており、より広い発展の可能性を秘めています。

1. 超大規模な計算能力

一般的な AI アプリケーションと比較して、大規模モデル アプリケーションのトレーニングと推論には、より強力なコンピューティング パワーのサポートが必要です。コンピューティング パワーが一般的な大規模モデルの収益を決定すると言えます。

中国でクラウドサービスを提供するアリババクラウドやテンセントクラウドは、それ自体が巨大なコンピューティングパワーを持っており、それが彼らが開発する大規模モデルの最大の競争力となっている。

2. 大量のデータ

大規模モデルをトレーニングするには、より大量のデータ、より優れたデータ品質、より多様なデータ ソースが必要です。したがって、誰もが十分な計算能力を持ち、ビッグモデルのアーキテクチャが類似している場合、データ量が多く、データ品質が高いという利点を持つ人は、それに応じてビッグモデルの品質を向上させ、ビッグモデルの適用効果も向上します。

3. オープンソースの大規模モデルである

もう 1 つの考慮事項は、それがオープン ソースの大規模モデルであるかどうかです。ソースコードはオープンなので、ユーザーのニーズに合わせていつでも変更やカスタマイズが可能で、基本的に無料です(無料使用は大規模モデルの利用の敷居を下げます。例えば、海外でのChatGPTや中国のWenxin Yiyanの人気は、まさに使いやすさにあります。誰でも登録するだけで体験できます)。これにより、より多くの開発者やユーザーが参加でき、大規模モデルの品質と安定性を向上させることができます。代表的なオープンソースの大規模モデルとしては、Alibaba の Tongyi Qianwen が挙げられます。

クローズドソースの大規模モデルは開発会社によって保守されています。開発会社は大規模モデルの品質と安定性をコントロールできますが、モデルの機能を継続的に向上させ、長期にわたって揺るぎない優位性を維持できない場合は、オープンソースに置き換えられる可能性があります。したがって、ChatGPT や Wenxin Yiyan などの大規模なクローズドソース モデルでは、強力なパフォーマンスを維持する必要があります。

4. APIインターフェースがあるかどうか

オープン サービス機能は、大規模モデルの機能を評価する上で重要な要素の 1 つです。大規模モデルの API インターフェイスを公開すると、そのオープン性と外部サービス機能が向上します。

オープン API インターフェースは専門家にとって不可欠です。研究者はこれを使ってさまざまなテストを行うことができます。個人の起業家もこのインターフェースを利用して実際のビジネスに応用することができます。

近い将来、大規模モデルが直面している技術的およびコスト的な問題が解決されるにつれて、関連するエンタープライズレベルのアプリケーションやコンシューマーアプリケーションの実装のペースが加速すると考えています。これにより、強力な大規模モデルメーカーとアプリケーションベースの製品のグループも強調され、これらのメーカーと製品は、今日台頭している大規模モデル製品から生まれる可能性が高くなります。

<<:  データセンター: クラウドと AI 導入の鍵となる要素

>>:  シリコンバレーのAI界で注目の記事:ジャスパーとVCはAIGCブームの最大の敗者となり、潮が引いた後に初めて誰が裸で泳いでいるかがわかる

ブログ    

推薦する

ディープラーニングの最適化手法の簡単な紹介: 勾配降下法

実際、ディープラーニングは多くの厄介な最適化問題を解決しています。ニューラル ネットワークは、問題に...

米連邦裁判所、AIが生成した芸術作品は著作権で保護できないと判決

米連邦地方裁判所のベリル・A・ハウエル判事は金曜日、AIによって生成された芸術作品は著作権保護を受け...

AIが医療画像診断を強化し、潜在的な病気が隠れる場所をなくす

【51CTO.comオリジナル記事】 [[376669]]医療は人々の生活に関わる最も重要な問題の一...

ハギングフェイスCEOが2024年のAI業界の6つの大きな変化を予測!

2024年にAI業界はどのように進化するのでしょうか? OpenAIのグレッグ・ブロックマン会長は...

人工知能の時代では、次の7つの重要な要素を念頭に置く必要があります

政府は、他の経済的、社会的進歩と同様に、AI とデータの競争力を重視すべきです。研究への投資や技術リ...

...

画像やテキストが無限の3D世界を生み出します!スタンフォード大学の呉嘉軍氏のチームの新しい研究は、ネットユーザーから「信じられない」と評された。

スタンフォード大学の呉嘉軍チームが『不思議の国のアリス』の傑作のAI版を制作!たった 1 つの画像ま...

ディープQ学習ネットワーク: 仮想ゲームから現実世界のアプリケーションへのギャップを埋める

翻訳者 |李睿レビュー | Chonglou人工知能と機械学習は、ヘルスケア、金融、エネルギー、輸送...

6000 以上の Web ページを閲覧した後、個人使用に最適な AI 製品のリストを選択しました。

[[220539]]リアム・ヘーネル編集者: Chaoxi、Yuanyuan、Harryこの記事で...

あなたは統計学者になれますか?トランスフォーマーの強力な学習メカニズム「自動アルゴリズム選択」

ChatGPT などの大規模な Transformer ベースの言語モデルには、非常に強力なコンテ...

生成型AIを学ぶ際の7つの課題

生成 AI は変革の原動力となり、機械が達成できるものの限界を押し広げています。テキストや画像の生成...

機械学習を使用して、GPU と TPU で高速化できる O(N) 複雑度のソート アルゴリズムを構築します。

[[238409]]ソートは、コンピュータ サイエンスにおいて常に最も基本的なアルゴリズムの 1 ...

フォーカス分析: 動画向けAIと画像向けAIの違い

[51CTO.com クイック翻訳] 画像処理と比較すると、ビデオから洞察を抽出したり、AI 技術を...

人工知能産業の急速な発展により、2021年以降、人工知能セキュリティの市場スペースは巨大になるでしょう。

[[439966]]人工知能は、人間の意識と思考の情報処理をシミュレートできるコンピュータ サイエ...

MIT スタンフォード トランスフォーマーの最新研究: 過剰トレーニングにより、中程度のモデルが構造一般化能力を「発現」できるようになる

人間にとって、文章は階層的です。文の階層構造は表現と理解の両方にとって非常に重要です。しかし、自然言...