ナレッジグラフをビッグモデルの仲間にしよう

大規模言語モデル (LLM) は、非常に流暢で一貫性のあるテキストを短時間で生成できるため、AI 会話、クリエイティブライティング、その他の幅広いアプリケーションに新たな可能性をもたらします。ただし、LLM にはいくつかの重要な制限もあります。彼らの知識はトレーニングデータから認識したパターンに限定されており、つまり世界に対する真の理解が欠けているということです。同時に、推論能力は限られており、論理的推論を実行したり、複数のデータソースから事実を統合したりすることができません。より複雑で答えの出ない質問に直面すると、答えは不合理または矛盾したものになり始め、それは婉曲的に「幻覚」と呼ばれます。

これらのギャップを埋めるために、外部ソースから関連知識を検索し、LLM がよりインテリジェントな応答を行うためのコンテキストを提供するという基本的な考え方を持つ、検索拡張生成 (RAG) システムが登場し始めています。既存のシステムのほとんどは、段落を取得するためにベクトル埋め込みの意味的類似性を使用しています。ただし、このアプローチには、真の相関関係が欠如している、事実を集約できない、推論の連鎖がないなどの欠点があります。これはまさにナレッジグラフの応用領域です。ナレッジグラフは、現実世界のエンティティと関係を構造化して表現したものです。グラフ検索は、コンテキスト事実間の相互接続をエンコードすることで純粋なベクトル検索の欠点を克服し、複数の情報ソースにわたって複雑なマルチレベル推論を実行できます。

ベクトル埋め込みとナレッジグラフを組み合わせることで、より高いレベルの推論機能を実現し、LLM の精度と解釈可能性を向上させることができます。この連携により、表面的な意味論と構造化された知識および論理が完璧に融合され、LLM では統計的学習と記号表現の両方が必要になります。

写真

1. ベクトル探索の限界

ほとんどの RAG システムは、ドキュメントコレクション内の段落のベクトルを検索して、LLM に関連するコンテキストを見つけるプロセスに依存しています。このプロセスにはいくつかの重要なステップがあります。

テキストエンコーディング: システムは、BERT などの埋め込みモデルを使用して、コーパス内の段落のテキストをベクトル表現にエンコードします。各記事は、セマンティクスを捉えるために密なベクトルに圧縮されます。
インデックス作成: これらのチャネルベクトルは、高次元ベクトル空間でインデックス作成され、高速な最近傍検索を可能にします。人気のある方法には、ファイス法とパインコーン法があります。
クエリのエンコーディング: ユーザーのクエリも、同じ埋め込みモデルを使用してベクトル表現にエンコードされます。
類似性検索: インデックス付けされた文章間で最近傍検索を実行し、距離メトリック (コサイン距離など) に基づいてクエリベクトルに最も近い文章を検索します。
段落の結果を返す: 最も類似した段落ベクトルを返し、元のテキストを抽出して LLM のコンテキストを提供します。

このパイプラインにはいくつかの大きな制限があります。

チャネルベクトルはクエリの意味的な意図を完全には捉えられない可能性があり、埋め込みは特定の推論的接続を表現できず、重要なコンテキストが見落とされてしまいます。
段落全体を 1 つのベクトルに圧縮すると、ニュアンスが失われ、文に埋め込まれた重要な関連詳細が不明瞭になります。
マッチングは段落ごとに独立して行われ、異なる段落にわたる共同分析は行われず、事実を結び付けて要約する必要のある答えを導き出す能力が欠けています。
ランキングとマッチングのプロセスは不透明で、特定の文章がより関連性が高いと判断される理由が明確ではありません。
意味上の類似性のみがエンコードされ、関係、構造、ルール、およびそれらの間のその他のさまざまな接続は表現されません。
意味ベクトルの類似性のみに焦点を当てると、真の理解を欠いた検索につながります。

クエリが複雑になるにつれて、取得したコンテンツを推論できないという点でこれらの制限がより顕著になります。

2. ナレッジグラフを統合する

ナレッジグラフは、相互接続されたネットワーク内のエンティティと関係に関する情報を表し、コンテンツ全体にわたる複雑な推論を可能にして、検索機能を強化します。

明示的な事実:事実は不透明なベクトルに圧縮されるのではなく、ノードとエッジとして直接キャプチャされるため、重要な詳細が保持されます。
コンテキストの詳細、エンティティには、重要なコンテキストを提供する説明、エイリアス、メタデータなどの豊富な属性が含まれています。
ネットワーク構造は、リレーショナルモデリングエンティティ、キャプチャルール、階層、タイムラインなどの間の実際の接続を表現します。
多段階の推論は、関係性を横断し、さまざまなソースからの事実を結び付けて、複数のステップにわたる推論を必要とする答えを導き出すことに基づいています。
共同推論は、エンティティ解決を通じて同じ現実世界のオブジェクトにリンクし、集合的な分析を可能にします。
説明可能な関連性、グラフトポロジーは、特定の接続ベースの事実がなぜ関連しているかを説明する透明性を提供します。
パーソナライゼーション、ユーザー属性、コンテキスト、および過去のインタラクションをキャプチャして結果をカスタマイズします。

ナレッジグラフは孤立した一致ではなく、グラフトラバーサルのプロセスを通じて、クエリに関連する相互に関連するコンテキストファクトを収集できます。説明可能なランキングはグラフのトポロジ構造に基づいており、構造化された事実、関係、コンテキストをエンコードすることで検索機能を強化し、正確なマルチステップ推論を可能にします。これにより、ベクトルのみの検索よりも関連性と説明力が高まります。

3. シンプルな制約を使用したナレッジグラフ埋め込みの改善

連続ベクトル空間に知識グラフを埋め込むことは、現在注目されている研究分野です。ナレッジグラフは、数学的演算をサポートするためにエンティティと関係をベクトル埋め込みとして表現することができ、追加の制約によって表現をさらに最適化できます。次に例を示します。

非負性制約は、エンティティの埋め込みを 0 から 1 の間の正の値に制限し、スパース性を誘発し、その正の性質を明示的にモデル化し、解釈可能性を向上させます。
含意制約は、対称性、反転、合成などの論理ルールを関係埋め込みの制約として直接エンコードし、これらのパターンを適用します。
信頼性モデリング、スラック変数を使用したソフト制約は、証拠に基づいて論理ルールの信頼性をエンコードできます。
正規化は有用な帰納的バイアスを課し、最適化を複雑にすることなく投影ステップのみを追加します。
解釈可能性。構造化された制約は、モデルによって学習されたパターンの透明性を提供し、推論プロセスを説明します。
精度制約は、仮説空間を要件を満たす表現に縮小することで一般化を改善します。

ナレッジグラフの埋め込みにシンプルで一般的な制約が追加され、より最適で解釈が容易で、論理的に互換性のある表現が実現します。埋め込みは、現実世界の構造と規則性を模倣する帰納的バイアスを獲得しますが、より正確で説明可能な推論のためにそれほど追加の複雑さは導入されません。

4. 複数の推論フレームワークを統合する

ナレッジグラフでは、新しい事実を導き出し、質問に答え、予測を行うための推論が必要であり、さまざまなテクノロジが互いに補完し合う強みを持っています。

論理ルールは知識を論理公理およびオントロジーとして表現し、定理証明を通じて合理的かつ完全な推論を可能にして、限定された不確実性の処理を実現します。グラフ埋め込みでは、ベクトル空間演算に埋め込まれた知識グラフ構造を使用します。これは不確実性に対処できますが、表現力に欠けます。ベクトル検索と組み合わせたニューラルネットワークは適応的ですが、その推論は不明瞭です。グラフ構造とデータの統計分析を通じてルールを自動的に作成することは可能ですが、その品質は不確かです。ハイブリッドパイプラインは、論理ルールを通じて明示的な制約をエンコードし、埋め込みによってベクトル空間演算が提供され、ニューラルネットワークは共同トレーニングを通じて収束の利点を得ます。ケースベース、ファジー、または確率論的ロジックのアプローチを使用して、透明性を高め、ルールの不確実性と信頼性を表現します。推論された事実と学習したルールをグラフに外部化することで知識を拡張し、フィードバックループを実現します。

重要なのは、必要な推論の種類を特定し、適切な手法にマッピングすることです。論理形式、ベクトル表現、ニューロンコンポーネントの構成可能なパイプラインを組み合わせることで、堅牢性と解釈可能性の両方が実現します。

4.1 LLM情報フローの維持

LLM のナレッジグラフで事実を取得すると、情報のボトルネックが発生するため、設計上関連性を保つ必要があります。コンテンツを小さなチャンクに分割すると分離性は向上しますが、周囲のコンテキストが失われ、チャンク間の推論が妨げられます。生成されたチャンクの要約により、重要な詳細が圧縮されて意味が強調され、より簡潔なコンテキストを提供できます。ソースコンテンツのコンテキストを維持するために、要約、タイトル、タグなどをメタデータとして追加します。元のクエリを、LLM のニーズをより適切にターゲットとするより詳細なバージョンに書き直します。ナレッジグラフのトラバーサル機能は、事実間の接続を維持し、コンテキストを維持します。時間または関連性で並べ替えると、LLM の情報構造を最適化でき、暗黙の知識を LLM に対して明示された事実に変換することで推論が容易になります。

目標は、取得した知識の関連性、コンテキスト、構造、および明示的な表現を最適化して、推論能力を最大化することです。粒度と凝集性の間にはバランスが必要です。ナレッジグラフの関係は、分離された事実のコンテキストを構築するのに役立ちます。

4.2 推論能力の解放

ナレッジグラフと組み込みテクノロジーを組み合わせることで、お互いの弱点を克服する利点が得られます。

ナレッジグラフは、エンティティと関係の構造化された表現を提供します。トラバーサル機能は、複雑な推論機能を強化し、多段階の推論を処理するために使用されます。埋め込みは、ベクトル空間での類似性ベースの操作のための情報をエンコードし、特定のスケールでの効果的な近似検索をサポートし、潜在的なパターンを表面化します。ジョイントエンコーディングは、ナレッジグラフ内のエンティティと関係の埋め込みを生成します。グラフニューラルネットワークは、微分可能なメッセージの受け渡しを介してグラフ構造と埋め込み要素を操作します。

ナレッジグラフは、まず構造化された知識を収集し、次に関連コンテンツに重点を置いた検索と取得を組み込みます。明示的なナレッジグラフの関係により、推論プロセスの説明可能性が提供されます。推論された知識はグラフに拡張でき、GNN は連続表現の学習を提供します。

このパートナーシップはパターン認識可能です!力とニューラルネットワークのスケーラビリティにより、構造化された知識の表現が強化されます。これは、言語人工知能に必要な統計学習と記号論理を進歩させる鍵です。

4.3 協調フィルタリングによる検索の改善

協調フィルタリングでは、エンティティ間の接続を使用して検索を強化します。一般的なプロセスは次のとおりです。

エンティティを表すノードと関係を表すエッジを使用してナレッジグラフを構築します。
特定のキーノード属性 (タイトル、説明など) の埋め込みベクトルを生成します。
ベクトルインデックス作成 - ノード埋め込みのベクトル類似性インデックスを構築します。
最近傍検索 — 検索クエリに対して、最も類似した埋め込みを持つノードを検索します。
共同調整 - PageRank などのアルゴリズムを使用して、ノード間の接続に基づいて類似度スコアを伝播および調整します。
エッジの重み — 重みは、エッジの種類、強度、信頼度などに基づいて調整されます。
スコアの正規化 - 調整されたスコアを正規化して、相対的なランキングを維持します。
結果の再ランク付け - 調整されたコラボレーションスコアに基づいて初期結果を再ランク付けします。
ユーザーコンテキスト - ユーザープロファイル、履歴、および設定に基づいてさらにカスタマイズされます。

写真

5. RAG エンジンの燃料供給 – データフライホイール

継続的に改善される高性能な検索拡張生成 (RAG) システムを構築するには、データフライホイールの実装が必要になる場合があります。ナレッジグラフは、構造化された世界の知識を提供することで、言語モデルの新しい推論機能を実現します。しかし、高品質のアトラスを構築することは依然として困難です。ここでデータフライホイールが登場し、システムの相互作用を分析することでナレッジグラフを継続的に改善します。

すべてのシステムクエリ、応答、スコア、ユーザーアクションなどのデータを記録し、ナレッジグラフの使用方法を可視化し、データ集約を使用して不適切な応答を明らかにし、これらの応答をクラスター化して分析し、知識のギャップを示すパターンを特定します。人間は問題のあるシステム応答を確認し、グラフ内の欠落または不正確な事実まで問題を遡って追跡します。次に、チャートを直接変更して、不足している事実を追加したり、構造を改善したり、明確さを高めたりします。上記の手順は何度も繰り返され、各反復ごとにナレッジグラフがさらに強化されます。

ニュースやソーシャルメディアなどのリアルタイムデータソースのストリーミングにより、新しい情報が継続的に提供され、ナレッジグラフが最新の状態に保たれます。クエリ生成を使用して重要な知識のギャップを特定し、埋めることは、ストリームが提供する範囲を超えています。グラフの穴を見つけ、質問し、不足している事実を取得して、それを追加します。各サイクルで、使用パターンを分析し、データの問題を修正することでナレッジグラフが徐々に強化され、改善されたグラフによってシステムのパフォーマンスが向上します。

このフライホイールプロセスにより、実際の使用状況からのフィードバックに基づいて、ナレッジグラフと言語モデルが共進化できるようになります。アトラスはモデルのニーズに合わせて積極的に変更されます。

要約すると、データフライホイールは、システムの相互作用を分析することによって、ナレッジグラフを継続的かつ自動的に改善するための足場を提供します。これにより、グラフ依存型言語モデルの精度、関連性、適応性が向上します。

6. まとめ

人工知能は外部の知識や推論と組み合わせる必要があり、ここでナレッジグラフが役立ちます。ナレッジグラフは、現実世界のエンティティと関係を構造化して表現し、世界に関する事実とそれらの間のつながりをエンコードします。これにより、相互に関連する事実を横断することで、複数のステップにわたる複雑な論理的推論が可能になります。

ただし、ナレッジグラフには、スパース性や不確実性の処理の欠如などの独自の制限があり、そこでグラフ埋め込みが役立ちます。知識グラフ要素をベクトル空間にエンコードすることにより、埋め込みにより大規模なコーパスからの潜在パターン表現の統計的学習が可能になり、効率的な類似性ベースの操作もサポートされます。

ナレッジグラフもベクトル埋め込みも、それ自体では人間のような言語知能を形成するのに十分ではありませんが、これらを組み合わせることで、構造化された知識表現、論理的推論、統計的学習の効果的な組み合わせが実現します。一方、ナレッジグラフは、ニューラルネットワークのパターン認識機能の上に記号論理と関係性を重ね合わせ、グラフニューラルネットワークなどのテクノロジは、情報転送グラフ構造と埋め込みを通じてこれらのアプローチをさらに統合します。この共生関係により、システムは統計学習と記号論理の両方を活用し、ニューラルネットワークと構造化された知識表現の長所を組み合わせることができます。

高品質なナレッジグラフの構築、ベンチマーク、ノイズ処理などには依然として課題が残っています。しかし、シンボリックネットワークとニューラルネットワークにまたがるハイブリッド技術は、依然として有望です。ナレッジグラフと言語モデルが開発され続けるにつれて、それらの統合により説明可能な AI の新しい分野が開拓されるでしょう。

<<:

>>: Apple: 画像モデルの事前トレーニングに言語モデルの自己回帰アプローチを使用する