ChatGPTに加えて、知っておくべき14の大きなモデルがあります

ChatGPTに加えて、知っておくべき14の大きなモデルがあります

多くの上司は人工知能を未来と見ており、多くのテクノロジーリーダーは ChatGPT を人工知能と同義語と見ています。しかし、ChatGPT は唯一の大規模言語モデルではなく、一部のソフトウェア プロジェクトやドメインでは最適な選択肢ではない可能性があります。ほぼ毎日、新たな競合企業が登場し、それぞれが次世代の AI ツールを目指して競い合っているようです。

あるモデルは他のモデルよりも優れているのでしょうか?多分。しかし、これらのモデルにはすべて欠陥や弱点があり、使用していくうちに徐々に発見されていきます。生成 AI は最初は素晴らしいように思えるかもしれませんが、時間が経つにつれてその予測不可能な側面が現れ始めます。

言語モデルベンチマーク

生成 AI 応答の品質を科学的に測定することは、モデルの範囲とその使用方法のため困難です。データ サイエンティストは数千、あるいは数百万ものテスト問題を入力して回答を評価できますが、テスト セットが 1 種類の質問のみに焦点を当てている場合、評価結果の精度は制限されます。そうは言っても、Hugging Face の Open LLM Leaderboard のようなリソースを参照するのは興味深いですが、必ずしも正確であるとは限りません。

LLM (大規模言語モデル) を評価する正確な方法を見つけるのは難しいですが、少なくとも LLM 間の切り替えは今のところ難しくありません。 OpenLLM や FastChat などのプロジェクトを使用すると、さまざまな API とインターフェース間でさまざまなモデルを簡単に接続できます。これらのモデルをつなぎ合わせたり、場合によっては並行して実行したりすることもできます。

無視できない重要な問題はコストです。すべての研究開発チームが注目と投資の急増を享受している一方で、大規模な言語モデルの構築には数か月、あるいは数年かかることもあります。チームはまずトレーニングデータを集め、それをエネルギーを大量に消費するハードウェアで処理しました。最後に、モデルを生成します。この仕事からどのように収益を得て継続していくかは、進化し続ける問題です。

結果をオープンソース化しようとしている組織もあれば、独自の課金モデルを持つサービスに頼っている組織もあります。オープンソース LLM は真の贈り物となり得ますが、それはモデルを展開して実行し続けるために必要な作業を処理できる場合に限られます。

以下は、ChatGPT 以外の大規模言語モデルの例 14 個です。これらはあなたのプロジェクトに適しているかどうかはわかりません。真実を知る唯一の方法は、プロンプトを送信し、結果を慎重に評価することです。

ラマ

これは、Facebook (現在は Meta) によって作成され、同社が表明している「オープン サイエンスへの取り組み」の一環としてリリースされた基本的な LLM です。誰でも Llama をダウンロードして、特定のアプリケーション向けにさらに細かく調整されたモデルを作成するための基盤として使用できます (Alpaca と Vicuna はどちらも Llama 上に構築されています)。このモデルは 4 つの異なるスケールで提供されています。わずか 70 億のパラメータを持つ小型バージョンは、すでに予想外の場所で使用されています。ある開発者は、わずか 4GB の RAM を搭載した Raspberry Pi で Llama を実行できたと主張しています。

アルパカ

スタンフォード大学の研究者らは、Meta の Llama 7B を採用し、ChatGPT のような指示に従うモデルと同様の一連のプロンプトでトレーニングしました。この微調整プロセスの結果、Alpaca 7B が誕生しました。これは、一般の人々が質問したり指示を与えたりすることで、Llama LLM にエンコードされた知識にアクセスできるモデルです。この軽量 LLM は、600 ドル未満のハードウェアで実行できると推定されています。

Alpaca 7B の作成者はトレーニング セットとそれを構築したコードを配布しているため、誰でもモデルを複製したり、異なるデータセットに基づいて新しいモデルを作成したりできます。

ビクーニャ

Llama のもう一つの子孫は、LMSYS.org の Vicuna です。 Vicuna チームは、マルチターンのインタラクションと指示に従う機能の作成に特に重点を置いて、ShareGPT から 70,000 種類の異なるダイアログのトレーニング セットを収集しました。 Vicuna-13b または Vicuna-7b として利用可能な Vicuna は、基本的なインタラクティブ チャット向けの最も競争力のある価格のオープン ソリューションの 1 つです。

ノードパッド

LLM によって作成された「言語的に正確な」テキストに誰もが魅了されるわけではありません。 NodePad の作成者は、テキストの品質が、ユーザーが基礎にある事実を注意深く調べる妨げになることが多いと考えています。優れたユーザー インターフェイスを備えた LLM は、「多くの場合、結果を不注意に装飾し、ユーザーが問題を判断するのを困難にします。」NodePad は、ユーザーがざっと目を通すだけの完璧な文章サンプルを作成するのではなく、探索とアイデア創出を促進するように設計されています。この LLM によって生成された結果は、多くの「マインド マッピング ツール」で見られるようなノードと接続として表示され、完成した文章のようには表示されません。ユーザーはモデルの百科事典的な知識を活用して、プレゼンテーションで迷うことなく優れたアイデアを伝えることができます。

シャチ

大規模言語モデルの第一世代は、規模を拡大することで成功を収め続けました。しかし、Microsoft チームの研究者が開発した Orca モデルは、この傾向を打ち破っています。このモデルは 130 億個のパラメータのみを使用するため、通常のコンピューターで実行できます。 Orca の開発者は、トレーニング アルゴリズムを改良して「説明的な軌跡」、「段階的な思考プロセス」、および「指示」を使用することでこの偉業を達成しました。 AIに単に生の素材から学習させるのではなく、教えるために設計されたトレーニング セットが Orca に与えられました。言い換えれば、人間と同じように、AI も深い水の中に放り込まれなければより速く学習します。初期の結果は有望であり、Microsoft チームは、このモデルがはるかに大規模なモデルと同等のパフォーマンスを発揮することを示すベンチマーク データを提供しました。

碧玉

Jasper の作成者は、すべてを知るモデルを構築するのではなく、コンテンツ作成に重点を置いたモデルを構築したいと考えていました。このシステムは、無制限のチャットセッションを提供するだけでなく、不動産物件のリストの作成や Amazon などのサイト向けの製品機能の作成など、特定のタスク向けに設計された 50 を超えるテンプレートを提供します。有料版は、一貫した口調でマーケティング コピーを作成したい企業向けです。

クロード

Anthropic は、リサーチや顧客サービスなど、企業向けの多くのテキストベースのタスクを処理できる便利なアシスタントとして Claude を開発しました。プロンプトを入力して回答を出力します。 Anthropic では、より複雑な指示を促し、ユーザーが結果をより細かく制御できるように、意図的に長いプロンプトを許可しています。 Anthropic は現在、Claude-v1 と呼ばれるフルモデルと、大幅に安価な簡易版である Claude Instant の 2 つのバージョンを提供しています。前者はより複雑で構造化された推論を必要とする仕事に適しており、後者は分類やレビューなどの単純なタスクをより高速かつ効率的に実行します。

セレブラス

特殊なハードウェアと汎用モデルが共進化すると、非常に高速で効率的なソリューションが得られます。 Cerebras は、ローカルで実行したい人のために、小規模 (1 億 1,100 万パラメータ) から大規模 (130 億パラメータ) まで、Hugging Face 上でさまざまなサイズの LLM を提供しています。しかし、大規模なトレーニング セットを効率的に処理するように最適化された、Cerebras 独自のチップ スケール統合プロセッサ上で実行されるクラウド サービスを使用することを望む人も多いでしょう。

ファルコン

アラブ首長国連邦の技術革新研究所(TII)は、実物大のファルコン40bと小型のファルコン7bモデルを開発した。彼らは、推論能力の向上に重点を置き、RefinedWeb からの多数の一般的な例を使用して Falcon モデルをトレーニングしました。その後、彼らはモデルを Apache 2.0 ライセンスの下でリリースすることを選択しました。これにより、このモデルは制限なく実験できる最もオープンなモデルの 1 つとなりました。

イメージバインド

多くの人は Meta をソーシャル メディアを支配する巨大企業だと考えていますが、同社はオープン ソース ソフトウェア開発でも強力な勢力を持っています。現在、人工知能への関心が高まっており、企業が自社のイノベーションの多くを共有し始めているのも不思議ではありません。 ImageBind は、AI がテキスト、オーディオ、ビデオなど、複数の異なるタイプのデータを同時に作成する方法を示すために設計されたプロジェクトです。言い換えれば、生成 AI は、許可されれば、架空の世界全体をつなぎ合わせることができるのです。

ゴリラ

生成 AI を使用してコードを記述するアプローチについて聞いたことがあるかもしれません。結果は表面的には素晴らしいように見えますが、詳しく調べてみると大きな欠陥が見つかります。構文は正しいかもしれませんが、API 呼び出しがすべて間違っており、存在しない関数を指している可能性もあります。 Gorilla は、プログラミング インターフェイスをより適切に処理できるように設計された LLM です。作成者は Llama から始めて、ドキュメントから直接取得したより詳細なプログラミングに合わせて微調整しました。 Gorilla チームは、成功率をテストするための独自の API ベースのテスト メトリック セットも提供しています。これは、コーディング支援に AI を活用したいプログラマーにとって重要な追加機能です。

オラ.ai

Ora は、ユーザーが特定のタスクに最適化されたカスタム チャットボットを作成できるチャットボットです。 LibrarianGPT は、本からの直接の引用を使用してあらゆる質問に答えようとします。たとえば、カール・セーガン教授は、セーガンの著作をすべて引用することができ、何十億年もの時間を生きることができるロボットです。独自のボットを作成することも、他のユーザーが既に作成した何百ものボットのいずれかを使用することもできます。

エージェントGPT

AgentGPT は、アプリケーションに必要なすべてのコードをつなぎ合わせるもう 1 つのツールです。休暇の計画や特定の種類のゲームのコードの作成などのタスクを処理できるエージェントを作成することを目的としています。テクノロジー スタックのソース コードの多くは GPL 3.0 に基づいて利用可能です。サービスとして実行されるバージョンも利用可能です。

倹約GPT

FrugalGPT は別のモデルではなく、特定の質問に答えるための最も安価なモデルを見つけるための戦略です。 FrugalGPT を開発した研究者たちは、多くの問題には最大かつ最も高価なモデルは必要ないことを認識しました。彼らのアルゴリズムは、最も単純なモデルから始まり、適切な答えが見つかるまで段階的に複雑な言語モデルを選択します。

FrugalGPT は、特定の問題ごとに最も適切なモデルを選択することでリソースの使用を最適化し、精度とパフォーマンスを犠牲にすることなくコストを削減することを目指しています。研究者の実験では、多くの問題では実際には複雑なモデルは必要ないため、この慎重なアプローチによってコストを最大 98 パーセント節約できる可能性があることが実証されています。

著者: ジェネレーティブ AI インサイト

オリジナルリンク | https://www.infoworld.com/article/3700869/14-llms-that-arent-chatgpt.html

<<:  サイバー犯罪におけるAI時代の到来

>>:  OpenAI の予測: スーパーインテリジェンスは 10 年以内に到来する!鄭済集落は人類を救い、4年で同盟を完全に征服した

ブログ    

推薦する

ビッグデータ、機械学習、ディープラーニングのためのコマンドラインツールの概要

[51CTO.com クイック翻訳] キーボードを握ってください! マウスや GUI がなくても、O...

機械学習とディープラーニングの違いは何ですか?

機械学習とディープラーニングのアルゴリズムフローついに人工知能研究僧に入学しました。機械学習とディー...

【就職活動】データサイエンスと機械学習のための最も包括的な面接ガイド

[[234501]]この記事では、データサイエンスと機械学習の面接で遭遇する可能性のあるさまざまな質...

OpenAIのCLIPは「平易な言葉」を使った正確な画像検索で皆を驚かせた

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

医療における人工知能:医師よりも正確

[[339138]]新しい医療用人工知能システムは、医師と同じように患者を診察することができます。画...

究極のAlp​​haGo、DeepMindの新アルゴリズムMuZero、著者の解釈

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

RAGから富へ:人工知能の幻想を払拭する

検索拡張生成は、AI モデルがデータを改善し、幻覚を軽減できるようにする最も有望な技術の 1 つと考...

人工知能は改めてすごいですね!科学者は偶然、死者を「蘇らせる」ことができることを発見した

マイクロソフトは現在、チャットボットを開発中との報道もある。将来的に実用化に成功すれば、デジタル技術...

MiniGPT-4: 高度な大規模言語モデルを使用した AI 視覚言語理解の向上

1. プロジェクトの背景と動機今年初め、OPEN AI の GPT-4 は前例のないマルチモーダル機...

現時点では、ディープラーニング以外の実装方法を模索する必要がある。

[51CTO.com クイック翻訳] ディープラーニングは確かに多くの印象的な成功事例をもたらしま...

商品化への探究を深めよう!ジェネレーティブAIが1兆ドル市場への道を開く

2023年10月17日(本日)、百度のシンプル検索はアップグレードを発表し、大規模モデルを通じて再構...

金融分野における機械学習の7つの主要な応用例をカウントダウン

[[269614]]ビッグデータダイジェスト制作編集者:劉兆娜機械学習は市場の新しいトレンドであり、...