強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

先日、人工知能技術の可能性とそれに対する人々の懸念について語った際、人工知能研究会社OpenAIのCEOサム・アルトマン氏は「 AIは止めることのできない竜巻のように、驚くべきスピードで発展している」と述べた。人工知能がその高度なスピードで世界を変えつつあることが分かる。

年初に人工知能における大規模モデルの流行を経験した後、 2023年10月現在、中国には汎用型大規模モデル(AGI)と垂直型大規模モデルの両方を含む、10億以上のパラメータを持つ大規模モデルを保有するメーカーと大学・研究機関が254社ありました。つまり、数日ごとに中国で新し​​い大型モデルが正式に発表されることになります。

しかし、大規模モデルのインテリジェント化と商業化はそれほど速くないことに気づく実務家が増えています。

ビッグモデル技術の進化とビジネスの実施により、一部の参加者は砂の中の砂のように淘汰され、最終的にはハードコアな技術力とリソースを備えた企業だけが生き残ることができます。

では、現時点で国内にこれほど多くの大型モデルが存在するのは、どのような種類のモデルなのでしょうか?どれが一番強いでしょうか?

ユニバーサル大型モデルと垂直大型モデル、どちらが将来性があるか

中国には一般大型機種や縦型大型機種(特大機種とも呼ばれる)など、80種類近くの大型機種があると言われています。 2つを比較すると、どちらが良いでしょうか?実際、アプリケーションの観点から両方を考慮すると、どちらも独自の特徴を持っています。

汎用大規模モデル(AGI)とは、自然言語処理分野の事前学習済みモデル、画像認識分野の事前学習済みモデルなど、複数の分野や業界に適用可能な大規模モデルを指します。

この大型モデルは、用途が広く、複数の分野で使用できます。よく耳にする人工知能企業OpenAIが開発したChatGPT、アリババのTongyi Qianwen、百度のWenxin Yiyanなどは、いずれも一般的な大規模モデルの代表例です。

垂直型ビッグモデルとは、医療分野のビッグモデル、金融分野のビッグモデル、物流分野のビッグモデルなど、特定の分野や業界向けに開発されたビッグモデルのことです。

たとえば、物流シナリオには多くの文書(物流活動において物流輸送のために発行される法的かつ有効な文書、例えば物流輸送契約文書など)と一貫性のない形式が関係しています。物流ビッグモデルは、標準化された方法でそれらを迅速かつ正確に識別し、構造化されたデータを提供して、エラー修正と完了操作を実行し、その後の運送状の分割、契約の履行と配布、およびその他のリンクの品質と効率を確保できます

このタイプの大型モデルは、より専門的で、特定の分野を対象としており、その分野の特定の問題をよりよく解決できます。そのため、垂直大型モデルは特殊大型モデルとも呼ばれます

それぞれを比較するのは非常に難しいと言えますので、どれが最も将来性が有望であるかを言うことも困難です。

強力な大型モデルにはどんなスーパーパワーがあるのでしょうか?

一般的な大型モデルと垂直型大型モデルの長所と短所を単一の法則で比較することは不可能ですが、強力な大型モデルが持つ「超能力」は常に共通しており、より広い発展の可能性を秘めています。

1. 超大規模な計算能力

一般的な AI アプリケーションと比較して、大規模モデル アプリケーションのトレーニングと推論には、より強力なコンピューティング パワーのサポートが必要です。コンピューティング パワーが一般的な大規模モデルの収益を決定すると言えます。

中国でクラウドサービスを提供するアリババクラウドやテンセントクラウドは、それ自体が巨大なコンピューティングパワーを持っており、それが彼らが開発する大規模モデルの最大の競争力となっている。

2. 大量のデータ

大規模モデルをトレーニングするには、より大量のデータ、より優れたデータ品質、より多様なデータ ソースが必要です。したがって、誰もが十分な計算能力を持ち、ビッグモデルのアーキテクチャが類似している場合、データ量が多く、データ品質が高いという利点を持つ人は、それに応じてビッグモデルの品質を向上させ、ビッグモデルの適用効果も向上します。

3. オープンソースの大規模モデルである

もう 1 つの考慮事項は、それがオープン ソースの大規模モデルであるかどうかです。ソースコードはオープンなので、ユーザーのニーズに合わせていつでも変更やカスタマイズが可能で、基本的に無料です(無料使用は大規模モデルの利用の敷居を下げます。例えば、海外でのChatGPTや中国のWenxin Yiyanの人気は、まさに使いやすさにあります。誰でも登録するだけで体験できます)。これにより、より多くの開発者やユーザーが参加でき、大規模モデルの品質と安定性を向上させることができます。代表的なオープンソースの大規模モデルとしては、Alibaba の Tongyi Qianwen が挙げられます。

クローズドソースの大規模モデルは開発会社によって保守されています。開発会社は大規模モデルの品質と安定性をコントロールできますが、モデルの機能を継続的に向上させ、長期にわたって揺るぎない優位性を維持できない場合は、オープンソースに置き換えられる可能性があります。したがって、ChatGPT や Wenxin Yiyan などの大規模なクローズドソース モデルでは、強力なパフォーマンスを維持する必要があります。

4. APIインターフェースがあるかどうか

オープン サービス機能は、大規模モデルの機能を評価する上で重要な要素の 1 つです。大規模モデルの API インターフェイスを公開すると、そのオープン性と外部サービス機能が向上します。

オープン API インターフェースは専門家にとって不可欠です。研究者はこれを使ってさまざまなテストを行うことができます。個人の起業家もこのインターフェースを利用して実際のビジネスに応用することができます。

近い将来、大規模モデルが直面している技術的およびコスト的な問題が解決されるにつれて、関連するエンタープライズレベルのアプリケーションやコンシューマーアプリケーションの実装のペースが加速すると考えています。これにより、強力な大規模モデルメーカーとアプリケーションベースの製品のグループも強調され、これらのメーカーと製品は、今日台頭している大規模モデル製品から生まれる可能性が高くなります。

<<:  データセンター: クラウドと AI 導入の鍵となる要素

>>:  シリコンバレーのAI界で注目の記事:ジャスパーとVCはAIGCブームの最大の敗者となり、潮が引いた後に初めて誰が裸で泳いでいるかがわかる

推薦する

デジタルツインがディープラーニングのデータ格差を埋める

企業がデータを活用するディープラーニング (DL) プロジェクトに着手する場合、そのデータを保護する...

MITはロボットの構造を自動設計できるコンピュータシステムを発明し、25年で最高の成果を達成した。

研究者にとって、適切な形状を選択することは、ロボットが特定の地形を移動できる能力にとって非常に重要で...

潜在能力を解き放つ: 人工知能がパーソナライズされた学習に与える影響

急速に進化する今日の教育環境では、テクノロジーの統合がかつてないほど普及しています。さまざまな技術の...

清華大学は顔認識技術に脆弱性を発見、セキュリティ問題を真剣に受け止める必要がある

このテストでは合計20台の携帯電話が選ばれ、そのうち1台は海外製、残りの19台は国内トップ5の携帯電...

鉄道欠陥検出における機械学習の実用化

【51CTO.com クイック翻訳】はじめに列車が走行しているとき、線路には大きな圧力がかかることが...

ブロックチェーン投資の10大リスクポイント。これらを理解していないなら投資しないでください!

「ブロックチェーン」という言葉は、間違いなく過去1年間で最もホットな投資概念です。ビットコインなど...

中国の人工知能はどれほど強力か?将来ロボットが手術を行えるようになるか?外国人は信じられないと言う

写真は人工知能中国の人工知能はどれほど強力か?将来ロボットが手術を行えるようになるか?多くの中国人は...

AIとソフトウェアが5Gデータセンターの変革を推進する方法

私たちはコンピューティングにおける革新の大きな段階を目撃しています。急速に加速する世界的な 5G 展...

2020年以降のAIとデータのトレンド

2019 年は、データ、分析、機械学習、人工知能の市場において継続的な発展が見られた年でした。 Sa...

自動運転のための強化学習:人間主導の経験ベースのアプローチ

[[428302]] 2021年9月26日にarXivにアップロードされた論文「人間のガイダンスによ...

プログラマーが知っておくべき10の基本的な実用的なアルゴリズムとその説明

[[128752]]アルゴリズム1: クイックソートアルゴリズムクイックソートは、Tony Hall...

無線測定・制御、顔認識、ドローン検査などハイテクが「史上最難関の大学入試」を護衛

本人確認のための顔認識、路上の車両の無線測定と制御、空中検査を行うドローン...人々の日常生活におけ...

大学入試結果が続々発表。ボランティア応募で人工知能が注目の選択肢に

今日から、全国各地の大学入試結果が続々と発表され、出願手続きが始まります。今年、各大学は、専門分野、...

LiDARと視覚認識、どちらがトップに立つでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

LLM で会話インターフェースを設計するにはどうすればいいですか?

著者:ヴァルン・シェノイ編纂者:王睿平大規模言語モデル (LLM) で構築されたテキスト ボックスの...