商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

当社のガイドで、ビジネスに AI の力を活用する方法を学びましょう。 RAG と CRAG の統合、ベクトル埋め込み、LLM、ヒント エンジニアリングについて学習します。 AI を責任を持って導入する企業に最適です。

企業向け AI 対応プラットフォームの構築

企業が生成 AI を導入する場合、戦略的に管理する必要がある多くのビジネス リスクに直面します。これらのリスクは相互に関連していることが多く、コンプライアンスの問題につながる潜在的な偏見からドメイン知識の欠如まで多岐にわたります。主な懸念事項としては、評判の失墜、法律および規制基準の遵守(特に顧客とのやり取りに関して)、知的財産権の侵害、倫理的問題、プライバシーに関する懸念(特に個人情報や識別可能なデータを扱う場合)などが挙げられます。

これらの課題に対処するために、検索拡張生成 (RAG) などのハイブリッド戦略が提案されています。 RAG は、AI 生成コンテンツの精度と関連性を向上させ、企業の AI イニシアチブに、より安全で信頼性の高いフレームワークを提供します。この戦略は、知識不足や誤報などの差し迫った問題に対処するだけでなく、法的および倫理的規範を遵守し、評判の失墜やコンプライアンス違反を防ぎます。

検索強化生成 (RAG) を理解する

検索拡張生成 (RAG) は、企業のナレッジ ベースからの情報を統合することで AI コンテンツ作成の精度と信頼性を向上させる高度なアプローチです。 RAG は、料理の基礎を徹底的に理解した上で、生まれ持った才能、包括的なトレーニング、創造力に頼るシェフだと考えてください。珍しいスパイスを使う必要がある場合や、斬新な料理のリクエストに応える必要がある場合、シェフは信頼できる料理の参考文献を参照して、食材が最適に活用されるようにします。

シェフがさまざまな料理を調理できるのと同じように、GPT や LLaMA-2 などの AI システムはさまざまなトピックに関するコンテンツを作成できます。しかし、特にエキゾチックな料理や大量の企業データのナビゲーションなどの複雑なトピックについて、具体的で正確な詳細を提供する必要がある場合は、精度と詳細さを実現するために特別なツールを使用します。

RAG の検索フェーズが不十分な場合はどうなりますか?

RAG 設定の堅牢性を強化するために、Corrective-RAG (CRAG) が導入されました。 CRAG は T5 を使用して、取得したドキュメントの関連性を評価します。企業ソースからの文書が無関係であると判断された場合、そのギャップは Web 検索を通じてデフォルトで埋められる可能性があります。

エンタープライズ規模の生成AIソリューションのアーキテクチャに関する考慮事項

アーキテクチャは基本的に、データの取り込み、クエリとインテリジェントな検索、生成プロンプト エンジニアリング、大規模言語モデルという 3 つの中核的な柱を中心に構築されています

データの取り込み:最初のステップは、会社の文書のコンテンツを簡単にクエリできる形式に変換することです。この変換は埋め込みモデルを使用して、以下の一連の操作に従って行われます。

  1. データ セグメンテーション: Confluence、Jira、PDF などのエンタープライズ ナレッジ ソースからのさまざまなドキュメントがシステムに取り込まれますこのステップでは、ドキュメントを「チャンク」と呼ばれる管理しやすい部分に分割します。
  2. 埋め込みモデル:これらのドキュメント チャンクは、埋め込みモデルに渡されます。埋め込みモデルは、テキストをその意味を表す数値形式 (ベクトル) に変換し、機械が理解できるようにするニューラル ネットワークです。
  3. インデックス ブロック:埋め込みモデルによって生成されたベクトルにインデックスが付けられます。インデックス作成は、効率的な検索を容易にする方法でデータを整理するプロセスです。
  4. ベクター データベース:すべてのベクター埋め込みはベクター データベースに保存されます。そして、各埋め込みによって表されるテキストを別のファイルに保存し、対応する埋め込みへの参照を必ず含めます。

クエリとインテリジェント検索:推論サーバーは、ユーザーの質問を受け取ると、同じモデルを使用してドキュメントを知識ベースに埋め込む埋め込みプロセスを通じて、質問をベクトルに変換します。次に、ベクトル データベースを検索して、ユーザーの意図に密接に関連するベクトルを識別し、コンテキスト強化のために大規模言語モデル (LLM) に送り込みます。

5.クエリ:アプリケーションおよび API レイヤーからクエリを実行します。クエリとは、ユーザーまたは他のアプリケーションが情報を検索するときに入力するものです。

6.埋め込みクエリの取得:生成された Vector.Embedding を使用して、ベクター データベースのインデックスで検索を開始します。ベクトル データベースから取得するベクトルの数を選択します。この数は、問題を解決するためにコンパイルして使用する予定のコンテキストの数に比例します。

7.ベクトル(類似性ベクトル):このプロセスは、クエリコンテキストに関連するドキュメントのチャンクを表す類似ベクトルを識別します

8.関連するベクトルを取得します。
ベクター データベースから関連するベクターを取得します。たとえば、シェフのコンテキストでは、レシピと準備手順という 2 つの関連するベクトルに相当する可能性があります。対応するスニペットが収集され、プロンプトとともに提供されます。

9.関連するチャンクを取得する:システムは、クエリに関連すると識別されたベクトルに一致するドキュメントの部分を取得します。情報の関連性が評価されると、システムは次のステップを決定します。情報が完全に一貫している場合は、重要度に応じて並べられます。情報が正しくない場合、システムはそれを破棄し、オンラインでより良い情報を探します。

生成ヒントエンジニアリングとLLM :生成ヒントエンジニアリングは、大規模な言語モデルが正しい答えを出すように導くために不可欠です。データのギャップを考慮した明確で正確な質問を作成することが含まれます。このプロセスは継続的であり、より良い対応を実現するために定期的な調整が必要です。また、これらの質問が倫理的で偏見がなく、デリケートな話題を避けていることを確認することも重要です。

10. ヒント エンジニアリング:取得されたチャンクは元のクエリとともに使用され、ヒントが作成されます。ヒントは、クエリ コンテキストを言語モデルに効果的に伝えるように設計されています。

11. LLM (大規模言語モデル):エンジニアリングプロンプトは、大規模言語モデルによって処理されます。これらのモデルは、受け取った入力に基づいて人間のようなテキストを生成できます。

12. 回答:最後に、言語モデルはプロンプトによって提供されたコンテキストと取得されたチャンクを使用して、クエリに対する回答を生成します。この回答は、アプリケーション層と API 層を通じてユーザーに送り返されます。

結論は

このブログでは、AI をソフトウェア開発に統合する複雑なプロセスについて説明し、CRAG にヒントを得たエンタープライズ生成の AI プラットフォームを構築することによる変革の可能性に焦点を当てます。ジャストインタイムエンジニアリング、データ管理、革新的な検索拡張生成 (RAG) 手法の複雑さに対処することで、AI テクノロジーをビジネスオペレーションの中核に組み込むアプローチの概要を説明します。今後の議論では、インテリジェント開発のための生成 AI フレームワークについてさらに詳しく検討し、AI の使用を最大化し、よりスマートで効率的な開発環境を確保するための具体的なツール、テクニック、戦略を検討します。

出典: https://medium.com/@genengineerAI/mastering-ai-in-business-building-an-enterprise-ready-ai-platform-with-rag-and-crag-b38baac8ad8b

著者: ベンカト・ランガサミー

<<:  人工知能、機械学習、ディープラーニングとは、いったい何なのでしょうか?

>>:  1024解像度で最速モデル、ByteDanceのオープンモデルSDXL-Lightningがリリース

ブログ    
ブログ    

推薦する

...

これでブリッジで腹筋運動ができるようになりました!中国初の3Dプリント橋が上海で公開

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能の急速な発展は人間に取って代わるのでしょうか?

[[347812]]現在の人工知能技術の発展は、主にコンピュータを媒体として活用し、自動化技術の発...

...

人工知能の道のりは長い

「人工知能」は最近、特に資本市場で非常に人気があります。実は、これはすべて予想されたことです。物語を...

カスタムデータセットにOpenAI CLIPを実装する

2021年1月、OpenAIはDALL-EとCLIPという2つの新しいモデルを発表しました。どちらも...

AIは当面、都市のゴミ出しを支援できないかもしれない

上海がゴミの分別を推進し始めて以来、クレイジーな上海寧は多くのジョークや絵文字を投稿し、大多数のネッ...

偽造AIがまた進化しました!たった一枚の写真で、スピーチと歌のビデオが自動的に生成されます

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

ドローン技術を都市計画に活用

ドローン技術は、都市計画がスマートシティを形成する方法を再定義するでしょう。都市計画は変化しており、...

懸念にもかかわらず、CIOはAIGCの利点を探求し、活用し続けています。

OpenAIは2022年11月にChatGPTをリリースし、その後Microsoftから100億ド...

ビジネスリーダーが AI プロジェクトの失敗を回避する 3 つの方法

なぜこれほど多くの AI プロジェクトが失敗するのでしょうか。そして、ビジネス リーダーはどうすれば...

GitHubで3,000以上のいいねを獲得した「機械学習ロードマップ」は、モンスターをアップグレードして倒す方法を教えてくれる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Jenkins 独自のユーザー データベース暗号化アルゴリズムの簡単な分析

Jenkins のアクセス制御は、セキュリティ ドメイン (認証) と承認戦略に分かれています。その...

軍事分野における人工知能の浸透と応用に関する考察

人工知能(AI)技術は現在、新たな急速な成長期に入り、将来の世界を変える可能性が最も高い破壊的技術と...