商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

商用 AI をマスターする: RAG と CRAG を使用したエンタープライズ レベルの AI プラットフォームの構築

当社のガイドで、ビジネスに AI の力を活用する方法を学びましょう。 RAG と CRAG の統合、ベクトル埋め込み、LLM、ヒント エンジニアリングについて学習します。 AI を責任を持って導入する企業に最適です。

企業向け AI 対応プラットフォームの構築

企業が生成 AI を導入する場合、戦略的に管理する必要がある多くのビジネス リスクに直面します。これらのリスクは相互に関連していることが多く、コンプライアンスの問題につながる潜在的な偏見からドメイン知識の欠如まで多岐にわたります。主な懸念事項としては、評判の失墜、法律および規制基準の遵守(特に顧客とのやり取りに関して)、知的財産権の侵害、倫理的問題、プライバシーに関する懸念(特に個人情報や識別可能なデータを扱う場合)などが挙げられます。

これらの課題に対処するために、検索拡張生成 (RAG) などのハイブリッド戦略が提案されています。 RAG は、AI 生成コンテンツの精度と関連性を向上させ、企業の AI イニシアチブに、より安全で信頼性の高いフレームワークを提供します。この戦略は、知識不足や誤報などの差し迫った問題に対処するだけでなく、法的および倫理的規範を遵守し、評判の失墜やコンプライアンス違反を防ぎます。

検索強化生成 (RAG) を理解する

検索拡張生成 (RAG) は、企業のナレッジ ベースからの情報を統合することで AI コンテンツ作成の精度と信頼性を向上させる高度なアプローチです。 RAG は、料理の基礎を徹底的に理解した上で、生まれ持った才能、包括的なトレーニング、創造力に頼るシェフだと考えてください。珍しいスパイスを使う必要がある場合や、斬新な料理のリクエストに応える必要がある場合、シェフは信頼できる料理の参考文献を参照して、食材が最適に活用されるようにします。

シェフがさまざまな料理を調理できるのと同じように、GPT や LLaMA-2 などの AI システムはさまざまなトピックに関するコンテンツを作成できます。しかし、特にエキゾチックな料理や大量の企業データのナビゲーションなどの複雑なトピックについて、具体的で正確な詳細を提供する必要がある場合は、精度と詳細さを実現するために特別なツールを使用します。

RAG の検索フェーズが不十分な場合はどうなりますか?

RAG 設定の堅牢性を強化するために、Corrective-RAG (CRAG) が導入されました。 CRAG は T5 を使用して、取得したドキュメントの関連性を評価します。企業ソースからの文書が無関係であると判断された場合、そのギャップは Web 検索を通じてデフォルトで埋められる可能性があります。

エンタープライズ規模の生成AIソリューションのアーキテクチャに関する考慮事項

アーキテクチャは基本的に、データの取り込み、クエリとインテリジェントな検索、生成プロンプト エンジニアリング、大規模言語モデルという 3 つの中核的な柱を中心に構築されています

データの取り込み:最初のステップは、会社の文書のコンテンツを簡単にクエリできる形式に変換することです。この変換は埋め込みモデルを使用して、以下の一連の操作に従って行われます。

  1. データ セグメンテーション: Confluence、Jira、PDF などのエンタープライズ ナレッジ ソースからのさまざまなドキュメントがシステムに取り込まれますこのステップでは、ドキュメントを「チャンク」と呼ばれる管理しやすい部分に分割します。
  2. 埋め込みモデル:これらのドキュメント チャンクは、埋め込みモデルに渡されます。埋め込みモデルは、テキストをその意味を表す数値形式 (ベクトル) に変換し、機械が理解できるようにするニューラル ネットワークです。
  3. インデックス ブロック:埋め込みモデルによって生成されたベクトルにインデックスが付けられます。インデックス作成は、効率的な検索を容易にする方法でデータを整理するプロセスです。
  4. ベクター データベース:すべてのベクター埋め込みはベクター データベースに保存されます。そして、各埋め込みによって表されるテキストを別のファイルに保存し、対応する埋め込みへの参照を必ず含めます。

クエリとインテリジェント検索:推論サーバーは、ユーザーの質問を受け取ると、同じモデルを使用してドキュメントを知識ベースに埋め込む埋め込みプロセスを通じて、質問をベクトルに変換します。次に、ベクトル データベースを検索して、ユーザーの意図に密接に関連するベクトルを識別し、コンテキスト強化のために大規模言語モデル (LLM) に送り込みます。

5.クエリ:アプリケーションおよび API レイヤーからクエリを実行します。クエリとは、ユーザーまたは他のアプリケーションが情報を検索するときに入力するものです。

6.埋め込みクエリの取得:生成された Vector.Embedding を使用して、ベクター データベースのインデックスで検索を開始します。ベクトル データベースから取得するベクトルの数を選択します。この数は、問題を解決するためにコンパイルして使用する予定のコンテキストの数に比例します。

7.ベクトル(類似性ベクトル):このプロセスは、クエリコンテキストに関連するドキュメントのチャンクを表す類似ベクトルを識別します

8.関連するベクトルを取得します。
ベクター データベースから関連するベクターを取得します。たとえば、シェフのコンテキストでは、レシピと準備手順という 2 つの関連するベクトルに相当する可能性があります。対応するスニペットが収集され、プロンプトとともに提供されます。

9.関連するチャンクを取得する:システムは、クエリに関連すると識別されたベクトルに一致するドキュメントの部分を取得します。情報の関連性が評価されると、システムは次のステップを決定します。情報が完全に一貫している場合は、重要度に応じて並べられます。情報が正しくない場合、システムはそれを破棄し、オンラインでより良い情報を探します。

生成ヒントエンジニアリングとLLM :生成ヒントエンジニアリングは、大規模な言語モデルが正しい答えを出すように導くために不可欠です。データのギャップを考慮した明確で正確な質問を作成することが含まれます。このプロセスは継続的であり、より良い対応を実現するために定期的な調整が必要です。また、これらの質問が倫理的で偏見がなく、デリケートな話題を避けていることを確認することも重要です。

10. ヒント エンジニアリング:取得されたチャンクは元のクエリとともに使用され、ヒントが作成されます。ヒントは、クエリ コンテキストを言語モデルに効果的に伝えるように設計されています。

11. LLM (大規模言語モデル):エンジニアリングプロンプトは、大規模言語モデルによって処理されます。これらのモデルは、受け取った入力に基づいて人間のようなテキストを生成できます。

12. 回答:最後に、言語モデルはプロンプトによって提供されたコンテキストと取得されたチャンクを使用して、クエリに対する回答を生成します。この回答は、アプリケーション層と API 層を通じてユーザーに送り返されます。

結論は

このブログでは、AI をソフトウェア開発に統合する複雑なプロセスについて説明し、CRAG にヒントを得たエンタープライズ生成の AI プラットフォームを構築することによる変革の可能性に焦点を当てます。ジャストインタイムエンジニアリング、データ管理、革新的な検索拡張生成 (RAG) 手法の複雑さに対処することで、AI テクノロジーをビジネスオペレーションの中核に組み込むアプローチの概要を説明します。今後の議論では、インテリジェント開発のための生成 AI フレームワークについてさらに詳しく検討し、AI の使用を最大化し、よりスマートで効率的な開発環境を確保するための具体的なツール、テクニック、戦略を検討します。

出典: https://medium.com/@genengineerAI/mastering-ai-in-business-building-an-enterprise-ready-ai-platform-with-rag-and-crag-b38baac8ad8b

著者: ベンカト・ランガサミー

<<:  人工知能、機械学習、ディープラーニングとは、いったい何なのでしょうか?

>>:  1024解像度で最速モデル、ByteDanceのオープンモデルSDXL-Lightningがリリース

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

保存しておくべき機械学習チートシート 27 選

機械学習にはさまざまな側面があり、調査を始めたときに、特定のトピックの要点を簡潔にリストしたさまざま...

機械学習プロジェクトに十分なデータがありませんか?ここに5つの良い解決策があります

人工知能プロジェクトに着手する企業の多くは素晴らしいビジネスアイデアを持っていますが、企業の AI ...

AIoTは単なる発言ではない

みなさんこんにちは。今日はAIoTについてお話します。 AIoT、つまり AI + IoT は、人工...

PS効果よりも優れています!このような写真編集ツールを使ったことがありますか?

そうです、グラフィックカードを作っている会社、NVIDIA です。 NV はグラフィック カード メ...

AI を活用した会話型顧客体験の可能性を引き出す方法

企業は AI ツールを使用して、顧客ロイヤルティにプラスの影響を与え、利益を増やすことができる会話型...

IoTとAIを活用した依存症治療

IoT によって促進される相互接続性と AI の学習機能は、幅広い問題を解決する可能性を示しています...

自動運転車のためのモデルベースのエンドツーエンドの深層強化学習戦略

実際の運転シナリオでは、観察と相互作用を通じて、インテリジェント運転車は知識を蓄積し、予測できない状...

PyTorch がトップカンファレンスを席巻: CVPR 論文は TensorFlow の 4 倍を占める

オープンソース フレームワークの分野では、PyTorch と TensorFlow の間で常に議論が...

...

知っておくべき 10 個の機械学習 API

[[257117]] [51CTO.com クイック翻訳] 今日では、携帯電話の写真ストリーム認識...

2018年、ブロックチェーンは監査人の仕事を破壊するでしょうか?

電卓が普及した後、そろばんの使い方しか知らなかった会計士は失業した。ゴールドマン・サックスは最盛期に...

CVPR で最も興味深い論文 | AI はぼやけた写真を復元できる

人生で、私たちは誰でもぼやけた画像に遭遇します。昔は、ぼやけた画像を復元することは不可能でした。PS...

騒動を巻き起こしたディープマインドの論文は万能ではない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...