ラフル・プラダン 出典| https://www.infoworld.com/article/3708254/addressing-ai-hallucinations-with-retrieval-augmented-generation.html 人工知能は現代の最も影響力のある技術になると期待されています。トランスフォーマー技術と生成 AIの最近の進歩は、大規模なイノベーションと創意工夫を解き放つ可能性を実証しています。 しかし、生成 AI には課題がないわけではありません。この変革的なテクノロジーの導入と価値創造を深刻に妨げる可能性のある課題もあります。生成 AI モデルの複雑さと機能が増大し続けるにつれて、入力データに基づかない出力の生成など、独自の課題も生じます。 これらのいわゆる「幻覚」は、モデルが、一貫性はあるものの、事実や入力とは文脈が合わない出力を生成する場合に発生します。この記事では、生成 AI の変革的影響について簡単に紹介し、このテクノロジーの欠点と課題を検討し、幻覚を軽減するために使用できる手法について説明します。 生成型AIの変革効果生成 AI モデルは、ディープラーニングと呼ばれる複雑な計算プロセスを使用して大規模なデータセット内のパターンを識別し、その情報を使用して説得力のある新しい出力を作成します。モデルは、ニューラル ネットワークと呼ばれる機械学習技術を組み込むことでこれを実現します。ニューラル ネットワークは、人間の脳が情報を処理して解釈し、時間をかけて学習する方法にヒントを得たものです。 OpenAI の GPT-4 や Google の PaLM 2 などの生成 AI モデルは、自動化、データ分析、ユーザー エクスペリエンスの革新を加速すると期待されています。これらのモデルは、コードを記述したり、記事を要約したり、さらには病気の診断にも役立ちます。ただし、これらのモデルの実行可能性と最終的な価値は、その精度と信頼性に依存します。医療、金融、法律サービスなどの重要な分野では、信頼できる精度が不可欠です。しかし、生成 AI の潜在能力を最大限に引き出すには、すべてのユーザーにとってこれらの課題に対処する必要があります。 大規模言語モデルの欠点LLM は基本的に確率的かつ非決定論的です。特定の単語シーケンスが次に出現する確率に基づいてテキストを生成します。 LLM には知識の概念がなく、推奨エンジンとしてトレーニングされたデータのコーパスを介したナビゲーションに完全に依存しています。生成されるテキストは、一般的に文法と意味の規則に従いますが、プロンプトとの統計的な一貫性を満たすことに完全に基づいています。 LLM のこの確率的な性質は、利点であると同時に欠点でもあります。正しい答えに到達すること、またはその答えに基づいて重要な決定を下すことが目標である場合、幻想は良くなく、有害となる可能性さえあります。しかし、目標が創造的な取り組みである場合、LLM を利用して芸術的創造性を開発し、アートワーク、ストーリーライン、およびスクリプトを比較的迅速に作成することができます。 ただし、目標に関係なく、 LLM モデルの出力を信頼できない場合は深刻な結果を招く可能性があります。これにより、これらのシステムの機能に対する信頼が損なわれるだけでなく、AI が人間の生産性とイノベーションを加速させる効果も大幅に低下することになります。 結局のところ、AI の良し悪しは、トレーニングに使用されたデータ次第です。 LLM 幻覚は主にデータセットとトレーニングの欠陥によって発生し、次のような側面が含まれます。
大規模言語モデルにおける幻覚への対処LLM における幻覚の問題に対処するためのアプローチはいくつかあり、微調整、キュー エンジニアリング、検索拡張生成 (RAG) などの手法が含まれます。
強化された生成データとリアルタイムデータを取得する検索強化型生成は、大規模言語モデルの精度を向上させる最も有望な技術の 1 つです。 RAG をリアルタイム データと組み合わせると、幻覚が大幅に軽減されることが示されています。 RAG により、企業は最新の独自データとコンテキスト データを使用して LLM を活用できるようになります。 RAG は幻覚を軽減するだけでなく、コンテキスト固有の情報で入力を充実させ、言語モデルがより正確でコンテキストに適した応答を生成できるようにします。エンタープライズ環境では、微調整は実用的ではないことがよくありますが、RAG は、パーソナライズされた情報に基づいたユーザー エクスペリエンスを提供するための低コストでメリットの高い代替手段を提供します。 RAG モデルの効率を向上させるには、LLM のネイティブ言語、つまりテキストの意味をエンコードする埋め込みと呼ばれる高次元の数学的ベクトルでデータを保存できる実用的なデータ ストアと RAG を組み合わせる必要があります。ユーザーがクエリを実行すると、データベースはそれを数値のベクトルに変換します。この方法では、同じ用語が含まれているかどうかに関係なく、ベクター データベースで関連テキストを照会できます。 セマンティック検索を使用して大量の非構造化データを保存および照会できる、可用性が高く、パフォーマンスの高いデータベースは、 RAG プロセスの重要なコンポーネントです。 |
<<: インテルが第3四半期の財務報告を発表、人工知能と新ファウンドリ事業が注目を集める
>>: ボストンダイナミクスは、ChatGPTなどの大規模モデルトレーニングを使用して、スポットロボット犬を「話すツアーガイド」に変えました。
Python は画像やビデオから顔を検出して認識できます。顔の検出と認識は、コンピューター ビジョ...
face_recognition は、強力でシンプル、使いやすい顔認識オープンソース プロジェクトで...
人工知能(AI)はノーベル賞の領域に入った。最近の研究により、人々にこのような感覚を与えるものが生み...
最近、清華大学の学者たちは、オートエンコーダーに基づく新しいトレーニング方法を提案しました。これによ...
この記事では、主にコンシステント ハッシュ アルゴリズムの原理とデータ スキューの問題について説明し...
「多体問題」(N 体問題とも呼ばれる)は単純に見えますが、実際には今日の数学で解決するのが非常に難し...
[[412385]]人工知能は現在、特に自動運転車でより広く深く活用されています。人工知能を使用して...
最近、ノルウェー科学技術大学の「DeepPrivacy: 顔の匿名化のための生成的敵対的ネットワーク...
「中東のシリコンバレー」と呼ばれるイスラエルはハイテク産業が発達しており、特にチップ産業や半導体技術...
ある研究者が、MITのコンピューターサイエンスの学位の宿題や試験問題を解くことができると主張するチャ...
アンビエント コンピューティングとは、テクノロジーが環境にシームレスに溶け込み、日常生活に浸透する世...
[[397592]] 1. 音源定位1. 電子走査アレイシステムが出力信号のパワーが最大となる点ま...