商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

当社のガイドで、ビジネスに AI の力を活用する方法を学びましょう。 RAG と CRAG の統合、ベクトル埋め込み、LLM、ヒント エンジニアリングについて学習します。 AI を責任を持って導入する企業に最適です。

企業向け AI 対応プラットフォームの構築

企業が生成 AI を導入する場合、戦略的に管理する必要がある多くのビジネス リスクに直面します。これらのリスクは相互に関連していることが多く、コンプライアンスの問題につながる潜在的な偏見からドメイン知識の欠如まで多岐にわたります。主な懸念事項としては、評判の失墜、法律および規制基準の遵守(特に顧客とのやり取りに関して)、知的財産権の侵害、倫理的問題、プライバシーに関する懸念(特に個人情報や識別可能なデータを扱う場合)などが挙げられます。

これらの課題に対処するために、検索拡張生成 (RAG) などのハイブリッド戦略が提案されています。 RAG は、AI 生成コンテンツの精度と関連性を向上させ、企業の AI イニシアチブに、より安全で信頼性の高いフレームワークを提供します。この戦略は、知識不足や誤報などの差し迫った問題に対処するだけでなく、法的および倫理的規範を遵守し、評判の失墜やコンプライアンス違反を防ぎます。

検索強化生成 (RAG) を理解する

検索拡張生成 (RAG) は、企業のナレッジ ベースからの情報を統合することで AI コンテンツ作成の精度と信頼性を向上させる高度なアプローチです。 RAG は、料理の基礎を徹底的に理解した上で、生まれ持った才能、包括的なトレーニング、創造力に頼るシェフだと考えてください。珍しいスパイスを使う必要がある場合や、斬新な料理のリクエストに応える必要がある場合、シェフは信頼できる料理の参考文献を参照して、食材が最適に活用されるようにします。

シェフがさまざまな料理を調理できるのと同じように、GPT や LLaMA-2 などの AI システムはさまざまなトピックに関するコンテンツを作成できます。しかし、特にエキゾチックな料理や大量の企業データのナビゲーションなどの複雑なトピックについて、具体的で正確な詳細を提供する必要がある場合は、精度と詳細さを実現するために特別なツールを使用します。

RAG の検索フェーズが不十分な場合はどうなりますか?

RAG 設定の堅牢性を強化するために、Corrective-RAG (CRAG) が導入されました。 CRAG は T5 を使用して、取得したドキュメントの関連性を評価します。企業ソースからの文書が無関係であると判断された場合、そのギャップは Web 検索を通じてデフォルトで埋められる可能性があります。

エンタープライズ規模の生成AIソリューションのアーキテクチャに関する考慮事項

アーキテクチャは基本的に、データの取り込み、クエリとインテリジェントな検索、生成プロンプト エンジニアリング、大規模言語モデルという 3 つの中核的な柱を中心に構築されています

データの取り込み:最初のステップは、会社の文書のコンテンツを簡単にクエリできる形式に変換することです。この変換は埋め込みモデルを使用して、以下の一連の操作に従って行われます。

  1. データ セグメンテーション: Confluence、Jira、PDF などのエンタープライズ ナレッジ ソースからのさまざまなドキュメントがシステムに取り込まれますこのステップでは、ドキュメントを「チャンク」と呼ばれる管理しやすい部分に分割します。
  2. 埋め込みモデル:これらのドキュメント チャンクは、埋め込みモデルに渡されます。埋め込みモデルは、テキストをその意味を表す数値形式 (ベクトル) に変換し、機械が理解できるようにするニューラル ネットワークです。
  3. インデックス ブロック:埋め込みモデルによって生成されたベクトルにインデックスが付けられます。インデックス作成は、効率的な検索を容易にする方法でデータを整理するプロセスです。
  4. ベクター データベース:すべてのベクター埋め込みはベクター データベースに保存されます。そして、各埋め込みによって表されるテキストを別のファイルに保存し、対応する埋め込みへの参照を必ず含めます。

クエリとインテリジェント検索:推論サーバーは、ユーザーの質問を受け取ると、同じモデルを使用してドキュメントを知識ベースに埋め込む埋め込みプロセスを通じて、質問をベクトルに変換します。次に、ベクトル データベースを検索して、ユーザーの意図に密接に関連するベクトルを識別し、コンテキスト強化のために大規模言語モデル (LLM) に送り込みます。

5.クエリ:アプリケーションおよび API レイヤーからクエリを実行します。クエリとは、ユーザーまたは他のアプリケーションが情報を検索するときに入力するものです。

6.埋め込みクエリの取得:生成された Vector.Embedding を使用して、ベクター データベースのインデックスで検索を開始します。ベクトル データベースから取得するベクトルの数を選択します。この数は、問題を解決するためにコンパイルして使用する予定のコンテキストの数に比例します。

7.ベクトル(類似性ベクトル):このプロセスは、クエリコンテキストに関連するドキュメントのチャンクを表す類似ベクトルを識別します

8.関連するベクトルを取得します。
ベクター データベースから関連するベクターを取得します。たとえば、シェフのコンテキストでは、レシピと準備手順という 2 つの関連するベクトルに相当する可能性があります。対応するスニペットが収集され、プロンプトとともに提供されます。

9.関連するチャンクを取得する:システムは、クエリに関連すると識別されたベクトルに一致するドキュメントの部分を取得します。情報の関連性が評価されると、システムは次のステップを決定します。情報が完全に一貫している場合は、重要度に応じて並べられます。情報が正しくない場合、システムはそれを破棄し、オンラインでより良い情報を探します。

生成ヒントエンジニアリングとLLM :生成ヒントエンジニアリングは、大規模な言語モデルが正しい答えを出すように導くために不可欠です。データのギャップを考慮した明確で正確な質問を作成することが含まれます。このプロセスは継続的であり、より良い対応を実現するために定期的な調整が必要です。また、これらの質問が倫理的で偏見がなく、デリケートな話題を避けていることを確認することも重要です。

10. ヒント エンジニアリング:取得されたチャンクは元のクエリとともに使用され、ヒントが作成されます。ヒントは、クエリ コンテキストを言語モデルに効果的に伝えるように設計されています。

11. LLM (大規模言語モデル):エンジニアリングプロンプトは、大規模言語モデルによって処理されます。これらのモデルは、受け取った入力に基づいて人間のようなテキストを生成できます。

12. 回答:最後に、言語モデルはプロンプトによって提供されたコンテキストと取得されたチャンクを使用して、クエリに対する回答を生成します。この回答は、アプリケーション層と API 層を通じてユーザーに送り返されます。

結論は

このブログでは、AI をソフトウェア開発に統合する複雑なプロセスについて説明し、CRAG にヒントを得たエンタープライズ生成の AI プラットフォームを構築することによる変革の可能性に焦点を当てます。ジャストインタイムエンジニアリング、データ管理、革新的な検索拡張生成 (RAG) 手法の複雑さに対処することで、AI テクノロジーをビジネスオペレーションの中核に組み込むアプローチの概要を説明します。今後の議論では、インテリジェント開発のための生成 AI フレームワークについてさらに詳しく検討し、AI の使用を最大化し、よりスマートで効率的な開発環境を確保するための具体的なツール、テクニック、戦略を検討します。

出典: https://medium.com/@genengineerAI/mastering-ai-in-business-building-an-enterprise-ready-ai-platform-with-rag-and-crag-b38baac8ad8b

著者: ベンカト・ランガサミー

<<:  人工知能、機械学習、ディープラーニングとは、いったい何なのでしょうか?

>>:  1024解像度で最速モデル、ByteDanceのオープンモデルSDXL-Lightningがリリース

ブログ    
ブログ    

推薦する

Go 言語 - データ構造とアルゴリズム プロジェクト

[[404457]]この記事はWeChatの公開アカウント「roseduanの執筆場所」から転載した...

テンセントの「Hunyuan」AIモデルがCLUE分類リストの歴史的記録を更新

4月29日、テンセントのAIモデル「Hunyuan」がCLUE(中国語言語理解評価コレクション)部門...

問題が VPN の問題であることを証明するにはどうすればよいですか?コンピュータ科学者は簡単な方法を発見した

P/NP 問題は、計算複雑性の分野における未解決の問題です。人々は、「すべての計算問題を妥当な時間内...

目に見えないAI技術は、知的な世界の秘密を理解するのに役立ちます

今日のインターネット技術の急速な発展により、目に見えないAI技術は生活のあらゆる側面に浸透しています...

AIの「冬」にご用心

1950 年代のコンピューティング ブームにより、「人工知能」という用語が誕生しました (1956 ...

人工知能のビジネス価値を最大限に引き出すための10の重要な役割

あらゆる業界でますます多くの企業が、ビジネス プロセスを変革するために AI を導入しています。しか...

ドローンの出現と市場の需要の変化

ドローンの市場、入手可能性、需要が長年にわたってどのように増加してきたかを学びます。映画の架空の世界...

アルゴリズムエンジニアも35歳でこのハードルにぶつかるのでしょうか?

[[327792]]はじめに: この質問は、実はほとんどのプログラマーに当てはまります。国内のイン...

...

ついにAI、BI、ビッグデータ、データサイエンスをわかりやすく説明する人が出てきた

01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物履歴、エネルギーなどの...

...

CISO が AI のリスクとメリットのバランスを取る方法

すべての AI プロジェクトにはある程度のリスクが伴い、生成 AI の急速な成長と展開により、セキュ...

...

EUがAIを活用して社会イノベーションを推進する方法

[[377176]] 2020年の新型コロナウイルスの世界的な蔓延は、人類にとって永遠の記憶となるこ...

AIと天気予報が出会うとどんな火花が散るのでしょうか?

SF作家の劉慈欣はかつて、自身の小説の中でこのような天気予報を描写した。小説の主人公は気象大学を卒...