ReAct: 言語モデルにおける推論とアクションを組み合わせてよりスマートな AI を実現

ReAct: 言語モデルにおける推論とアクションを組み合わせてよりスマートな AI を実現

本日は、Google Research とプリンストン大学の研究者グループが言語モデルにおける推論と動作を組み合わせる可能性を探求した論文「REACT: 言語モデルにおける推論と動作の相乗効果」を紹介します。大規模言語モデル (LLM) の推論 (思考連鎖の促進) とアクション (行動計画の生成) の機能は別々のトピックとして研究されてきましたが、両方の機能が 1 つのシステムに統合されたのは今回が初めてです。 ReAct フレームワークにより、仮想エージェントは Web や SQL データベースへの接続などのツールを使用できるようになるため、ほぼ無制限の拡張が可能になるため、これは重要な論文であると思います。

推論と行動の力

人間の知能は、タスク指向の行動と次のステップに関する推論のシームレスな組み合わせによって特徴付けられます。この能力により、予期せぬ状況にも適応しながら、新しいタスクを素早く学習し、信頼できる決定を下すことができます。 ReAct は、言語モデルでこの相乗効果を再現し、インターリーブ方式で推論手順とタスク固有のアクションを生成できるようにすることを目的としています。

ReActの仕組み

ReAct は、大規模な言語モデルに、特定のタスクの言語推論履歴のステップとアクションを生成するよう促します。これらのプロンプトは、モデルの思考とアクションの生成を導く少数のコンテキスト例で構成されています。コンテキストの例を下の図に示します。これらの例は、エージェントを循環的なプロセス(思考の生成、アクションの実行、そしてそのアクションの結果を観察すること)に導きます。 ReAct は推論トレースとアクションを組み合わせることで、モデルが動的推論を実行できるようにします。これにより、高レベルの計画を生成し、外部環境と対話して追加情報を収集することもできます。

アプリケーションと結果

研究者らは、質問への回答、事実の検証、テキストベースのゲーム、Web ナビゲーションなど、さまざまな言語推論および意思決定タスクに ReAct を適用しました。結果は優れており、ReAct は解釈可能性と信頼性の点で他の最先端のベースラインを一貫して上回っています。

質問応答と事実検証のタスクにおいて、ReAct は単純な Wikipedia API と対話することで、推論における一般的な幻覚とエラー伝播の問題を克服します。推論の痕跡のないベースラインよりも解釈しやすい、タスクを解決するための人間のような手順を生成します。インタラクティブな意思決定ベンチマークでは、ReAct は、コンテキスト例が 1 つまたは 2 つしかない場合でも、模倣学習および強化学習の方法を大幅に上回ります。

推論、行動、観察のステップを織り交ぜることで、ReAct の根拠と信頼性は向上しますが、この構造によって推論ステップを策定する際の柔軟性が制限され、低下するため、一部のタスクでは思考連鎖プロンプトよりも推論エラー率が高くなります。

推論と行動の重要性

研究者らは、さまざまなタスクにおける推論と行動の重要性を理解するためにアブレーション実験も行った。彼らは、ReAct の内部推論と外部アクションの組み合わせが、推論またはアクションのいずれか一方のみに焦点を当てたベースラインよりも一貫して優れていることを発見しました。これは、より効果的な意思決定のためにこれら 2 つのプロセスを統合することの価値を強調しています。

今後の方向性

ReAct は有望な結果を示していますが、まだ改善の余地があります。研究者らは、ReAct をスケールアップしてより多くのタスクをトレーニングおよび操作し、強化学習などの補完的なパラダイムと組み合わせることを提案しています。さらに、より多くの人間が注釈を付けたデータを使用してモデルを微調整すると、パフォーマンスがさらに向上します。

結論は

ReAct は、よりスマートで汎用的な AI システムの開発に向けた一歩であり、Langchain ライブラリの非常に便利なエージェント機能も強化します。言語モデルにおける推論と動作を組み合わせることで、さまざまなタスクでパフォーマンスが向上し、解釈可能性と信頼性も向上することが実証されました。 AI が進歩し続けるにつれて、推論と動作の統合は、より有能で適応性の高い AI システムを作成する上で重要な役割を果たすようになります。

論文の宛先:

<<:  Stack OverflowがAI搭載製品「OverflowAI」を発表

>>:  GPT-4 よりも優れており、クローズドソース モデルよりも優れています。コードラマの謎のバージョンが公開

ブログ    
ブログ    
ブログ    

推薦する

...

AIとIoTの相互運用性に対する需要は2021年も増加し続ける

[[390687]]画像ソース: https://pixabay.com/images/id-440...

都市のモビリティの変化: スマートシティにおけるインテリジェント交通

持続可能で住みやすい都市空間を創造するために、世界中の都市がスマートシティの概念を採用しています。こ...

機械に記憶を与える: DeepMind の主要研究は柔軟な重み統合アルゴリズムを提案

世界で最も注目されている人工知能研究機関のひとつである Google DeepMind は、常に私た...

CNN 推論エンジンを使用して IoT デバイスにディープラーニングを実装するにはどうすればよいですか?

[[212457]]ディープラーニング技術により、モノのインターネット (IoT) デバイスは非構...

...

無人運転車が道路上でテストされる予定でしょうか?あなたの人生はひっくり返るでしょう

無人運転車はいつ公道を走るようになるのでしょうか?この時期は私たちが考えていたよりも少し早いかもしれ...

人工知能が人間の能力を高める4つの方法

調査会社ガートナーの調査によると、2021年までに世界中の組織が人工知能を通じて約3兆ドルのビジネス...

AIツアーはAIIA AI開発者会議のサポートで終わりに近づいています

強力なコンピューターと複雑かつ絶えず変化する人間の知性が出会うと、どのような火花が散るのでしょうか?...

KServe、Kubernetes環境に基づく高度にスケーラブルな機械学習デプロイメントツール

ChatGPT のリリースにより、機械学習技術の活用を避けることがますます難しくなってきています。メ...

リスク管理シナリオの全プロセスモデルの構築と適用

オンライン マイクロクレジットの一般的なリスク管理シナリオは、融資前、融資中、融資後の段階に分けられ...

...

Java プログラミング スキル - データ構造とアルゴリズム「マージ ソート」

[[393503]]基本的な紹介マージソートは、マージの考え方を使用するソート方法です。このアルゴ...

IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。

昨年 10 月、マイクロソフトの AI および研究部門の研究者およびエンジニアのチームは、自社の音声...

調査 | AIと機械自動化が社会に与える影響に関する世界の見解

[[358905]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...