これらの提案により、LLM 申請の精度が向上し、適切な LLM を選択する方法についての考慮事項も含まれます。
OpenAI が最初の ChatGPT モデルをリリースしてから 1 年後、生成 AI への関心が爆発的に高まりました。大規模言語モデル (LLM) 駆動型アプリケーションは現在、生産性と効率性に関する企業の考え方の最前線にあります。生成 AI アプリケーションを構築するためのツールとフレームワークも劇的に拡張されました。しかし、生成 AI 出力の精度については依然として懸念が残っており、開発者は堅牢で信頼性の高いアプリケーションを構築するために、これらの問題に対処する方法を迅速に学ぶ必要があります。 以下は、LLM 申請の精度を向上させるための提案とテクニック、および適切な LLM を選択する際に考慮すべき事項です。これらの問題はそれぞれ本質的に複雑なので徹底的に議論することはできませんが、さらなる調査のための出発点をいくつか提供することはできます。 Streamlit は、機械学習およびデータ サイエンスの Web アプリケーションを迅速に構築して共有するための無料のオープン ソース フレームワークです。同社は最近、Streamlit Community Cloud 上で 13,000 人以上の開発者が構築した 21,000 以上の LLM アプリを分析したレポートを発表しました。これにより、以下の推奨事項のいくつかについて、これまで開発者が使用したツールとテクニックについての洞察が得られます。 たとえば、ベクトル検索ツールは、LLM 駆動型アプリケーションでのコンテキスト推奨の改善に非常に効果的ですが、当社の調査によると、現在ベクトル機能を使用している開発者は少数であり、これは将来に大きなチャンスがあることを示しています。 より多くの開発者が生成 AI の力を活用してアプリケーションを構築するようになると、AI ベースの検索機能や会話型および支援型のエクスペリエンスが、さまざまなカテゴリや業種のアプリに組み込まれるようになるでしょう。ここでは、開発者が LLM を活用したより優れたアプリケーションを構築し、組織に真の変革をもたらすのに役立つ 4 つのヒントを紹介します。 エージェントとオーケストレーションによるよりスマートなアプリケーションの構築LangChain や LlamaIndexなどのオーケストレーション フレームワークは、追加のツールやエージェントを使用してモデルを補完し、LLM ベースのアプリケーションの機能を強化できます。この文脈では、エージェントは、自然言語で表現された追加機能をアプリケーションに組み込むことができるプラグイン システムと考えることができます。 これらのエージェントを組み合わせることで、AI 推論の改良、バイアスへの対処、外部データ ソースの統合など、LLM 機能を管理および最適化できます。これらのエージェントは、LLM に、間違いを犯していないかどうか、タスクを正常に完了するために必要な手順を振り返る方法を提供することもできます。 例として、開発者が特定の機能を提供する API と API を説明するドキュメントを作成する様子を想像してください。API はコードで表現され、ドキュメントは自然言語で表現されます。エージェントも同様に動作しますが、ドキュメントは LLM 向けであり、他の開発者向けではない点が異なります。したがって、LLM は手元のタスクを確認し、エージェントのドキュメントを確認して、エージェントがタスクの完了を支援できるかどうかを判断します。 これらのエージェントは、アプリケーションが自身の間違いを反映して修正する方法を提供することで、LLM アプリケーションの堅牢性も向上させます。たとえば、LLM アプリケーションがデータベース内の在庫レベルをチェックするなどのタスクを実行するために SQL コードを記述したが、コードに間違いがあったとします。標準的な「単純な」LLM アプリケーションの場合、このエラーはこれで終わりです。 ただし、アプリケーションに SQL を実行するエージェントがある場合は、エラーを確認し、エージェントを使用して、どのように変更すべきかを判断し、エラーを修正できます。これは構文上の小さな変更かもしれませんが、エージェントがなければ、LLM はエラーを判断する方法がありません。 ベクターマジックとRAGを使って幻覚と戦う場合によっては、使用している LLM が、目的のタスクを完了するために必要なすべての情報にアクセスできないことがあります。ヒントに追加情報を挿入することは可能ですが、ほとんどの LLM ではこれらのヒントのサイズに制限があります。これらの制限を回避するために、LLM はベクトルを使用して外部データベースを照会する必要がある場合があります。これは、検索拡張生成 (RAG) と呼ばれる手法です。 RAG が LLM アプリケーションに対して何ができるかを理解するには、LLM アプリケーションを 3 つの異なるレベルに分割すると役立ちます。
ここで RAG が登場します。外部データベースは、多くの場合、ベクターを使用して意味的にインデックス付けされるため、最近ではベクター データベースやベクター検索ツールについてよく耳にすることがあるかもしれません。 ベクター データベースとベクター検索を備えたアプリケーションでは、テキスト、画像、ビデオ、オーディオなどの大規模な非構造化データセットを分類することで、高速なコンテキスト検索が可能になります。これは、より迅速かつ正確なコンテキスト推奨を行うのに非常に効果的です。しかし、ベクターツールの使用率はまだ高くありません。 Streamlit の調査によると、生成された AI 搭載アプリのうち、何らかのベクター テクノロジを使用しているのはわずか 20% でした。 チャットボットはユーザーにクエリを絞り込む強力な手段を提供しますチャットボットは生成 AI を主流にしましたが、それが効果的なインターフェースになるかどうかについては懐疑的な見方もありました。チャットボットはユーザーに自由を与えすぎており、LLM アプリケーションがどのように使用されているかについて十分なコンテキストを提供していないと主張する人もいます。過去の失敗に失望した人々もいた。 「Clippy は大失敗だったのに、なぜ今日チャットボットが成功するのか?」 当然のことながら、チャットボットが適切かどうかは、アプリケーションの目的によっても異なります。しかし、チャットボットには見逃せない非常に便利な機能が少なくとも 1 つあります。それは、スムーズな人間とコンピューターのインターフェースを通じて、ユーザーにコンテキストを追加し、回答を絞り込むための簡単で直感的な方法を提供することです。 これがなぜ強力なのかを理解するには、検索エンジンを想像してください。通常、ユーザーが検索エンジンのクエリを改善する方法はありません。結果がわずかに偏っている場合、検索エンジンに「もう一度試して、X に関する回答を除外する」ように指示したり、「Y に重点を置く」ように指示したりすることはできません。これは便利で強力な機能であり、チャットボットが LLM アプリケーションに提供する機能です。 調査によると、Streamlit 上に構築された生成 AI アプリケーションの 28% はチャットボットであり、アプリケーションの 72% は一般的に会話の改善を許可していません。一方、調査では、これらのチャットボットの週ごとの使用率が約 40% に上昇したのに対し、チャットボット以外のアプリケーションの使用率は低下したことが示されました。したがって、チャットボットはエンドユーザーにとって好ましいインターフェースとなる可能性があります。レポートにはさまざまなテキスト入力モードを備えたアプリの例が含まれているため、どのような機能が可能かを確認できます。 オープンソースのLLMを含むGPTの代替案を検討するGPT の基本モデルは今でも最もよく知られている LLM であり、非常に強力ですが、過去 1 年間でさらに多くのオプションが登場しており、そのうちのいくつかはアプリケーションにより適している可能性があります。考慮すべき要素には、LLM に必要な知識の範囲、LLM の規模、トレーニングのニーズと予算、LLM がオープン ソースか独自のものかが重要かどうかなどがあります。テクノロジーの多くの事柄と同様に、トレードオフが存在します。 社内使用のための生成 AI アプリケーションを構築する場合は、社内データで LLM をトレーニングすることをお勧めします。ほとんどの企業では、セキュリティ上の理由から機密データをパブリック LLM と共有することはできないため、多くの企業は既存のクラウド セキュリティ境界内で LLM を実行しています。これにより、多くの場合、AI21 や Reka などの小規模な LLM に進むことになります。 非常に大規模な LLM はレイテンシも高くなる傾向があり、必要な計算リソースのために実行コストが一般的に高くなります。アプリケーションがテキストの翻訳やドキュメントの要約などの比較的単純なタスクを実行する場合は、より小さな LLM でも十分に機能し、使用と運用にかかるコストがはるかに低くなります。 また、ソース コード、トレーニング データ、重み、その他のモデルの詳細が通常は公開されない OpenAI、Anthropic、Cohere などの企業の独自の LLM よりも、Meta の LLaMA などのオープン ソース LLM を推奨する理由がある場合もあります。オープンソース LLM では、推論のために自己ホスティングまたはホスティング プロバイダーを使用する必要がありますが、ソース コードやその他のモデルの詳細は簡単に入手できます。 今すぐジェネレーティブAIを始めましょう生成 AI は依然として急速に進化している分野ですが、必要なツールとテクニックは急速に進歩しており、今日から始めるための選択肢は数多くあります。この機会を捉える開発者は、AI アプリケーションを日常のビジネス運用やタスクの標準的な機能として活用することで、組織に多大な価値をもたらすことができます。生成 AI が組織内の役割と責任を再形成し続けるにつれて、LLM 駆動型アプリケーションに飛び込んで専門家になる開発者が目立つようになり、上記のアドバイスは正しい方向に進み始めるのに役立つはずです。 |
<<: 人工知能とビッグデータがビジネス環境をどう変えるのか
[51CTO.comより引用] 先日、インテルは、自動運転プラットフォームプロバイダーのMobile...
執筆者 | Yun Zhao制作:51CTO テクノロジースタック(WeChat ID:blog)最...
[51CTO.comよりオリジナル記事] 静かな2019年を経て、自動運転業界は新年を迎え、徐々に活...
人工知能(AI)技術はどこまで発展したのでしょうか? [[278665]]将来、AIが社会に本格的に...
昨日、米国議会の公聴会が中国国内の複数のメディアのトレンド検索のトップに躍り出た。 これを一言でまと...
[[422760]] [51CTO.com クイック翻訳]事実によれば、ロボティック プロセス オー...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
【51CTO.com 速訳】ディープラーニングの課題過去数年間で、ディープラーニング モデルの主要構...
[[249559]]近年のAI分野を調査していく中で、近年、世界中の研究者の視野の中に敵対的攻撃とい...
人工知能アルゴリズムやディープラーニングなどのさまざまな技術の徹底的な発展により、人工知能(AI)は...
人工知能の人気が高まってきており、人工知能分野でビジネスを始めたい人も増えてきています。しかし、人工...
マイクロソフトの最近の研究により、ラマ2号は選択的健忘症にかかり、ハリー・ポッターに関するすべてのこ...