7BサイズのモデルはAIエージェントも処理できますか?最近、Kuaishouは「KwaiAgents」をオープンソース化しました。週末のスキーについて質問すると、会場を探すだけでなく、その日の天気も考慮してくれます。 大規模言語モデル (LLM) は言語をモデル化することで多くの知識を習得し、一定の認知能力と推論能力を備えていることは誰もが知っています。しかし、現在最も強力な GPT-4 であっても、単独で使用すると、深刻な意味不明な発言をすることになり、世界とのリアルタイムのやり取りを維持することはできません。 AI エージェントは、この問題を解決する 1 つの方法です。ビッグ モデルのタスクを計画し、反映し、ツールを呼び出す能力を刺激することで、ビッグ モデルは現実世界のツールを使用して、生成されたコンテンツの精度を向上させ、複雑な問題を解決できるようになります。今回、Kuaishouとハルビン工業大学が共同で「KwaiAgents」を開発し、これにより「小型」7B/13Bの大型モデルでGPT-3.5を上回る成果を達成することが可能となり、これらのシステム、モデル、データ、評価はすべてオープンソース化されました。
「KwaiAgents」の Github ホームページから、オープンソース コンテンツに次のものが含まれていることがわかります。
システムKAgentSys システムは、メモリ メカニズムとツール ライブラリを備えた、認知コアとしての大規模モデルに基づく反復的な自動化システムです。主に以下のものが含まれます。
今回、KAgentSysの一部の機能がオープンソース化され、システムは段階的にアップグレードされ、公開される予定です。 モデルトレーニング中に単一のテンプレートによって引き起こされる過剰適合の問題を回避するために、チームはメタエージェントチューニング(MAT)手法を提案しました。これは、トレーニングデータにさらに多くのエージェントプロンプトテンプレートを導入し、エージェント機能における大規模モデルの汎用性を高め、効果を向上させるものです。 メタエージェントチューニング (MAT) は 2 つのフェーズで構成されます。
レビューKAgentBench は、数千のデータ ポイントに手動で注釈を付けることですぐに使用でき、1 行のコマンドでさまざまなテンプレートのさまざまな側面から大規模モデルのエージェント機能を評価できます。 上図に示すように、KAgentBenchでは、異なる種類の能力が入力されます。各クエリには、複数のテンプレートと手動で編集された複数の実際の回答が装備されており、精度と一般化を総合的に評価することを目的としています。次の表は、MATチューニング後の7B-13Bモデルのさまざまな能力の向上を示しており、GPT-3.5の効果を上回っています。 同時に、この研究では、人間の注釈者に、200の事実と時宜にかなった質問(「アンディ・ラウは今年何歳ですか」など)について、さまざまな大規模モデルとエージェントシステムを相互評価するよう依頼し、KAgentSysシステムとMAT後のモデルが大幅に改善されたことがわかりました(パーセンテージの前のパーセンテージは正確率、括弧内のパーセンテージは5段階評価の平均スコアです)。 通常、Web 検索だけに頼ると、一部のロングテールの質問や人気のある質問に対して適切な結果が返されません。たとえば、「アントネッラはメッシより何日年上ですか?」のようなロングテールの質問をすると、検索結果には2人についての噂が返されることが多いのですが、いくつかの重要な情報は返されません。 KAgentSys は、百科事典検索ツールを呼び出して正確な生年月日を取得し、次に time_delta 時間差ツールを呼び出して年齢差を計算することで、この質問に正確に答えることができます。 チームは、AIエージェントは非常に有望な道であると述べました。今後、一方ではこの方向でコア技術を蓄積し続け、コミュニティ全体に新たな活力を継続的に注入する一方で、エージェント技術とKuaishouのビジネスの組み合わせを積極的に模索し、より興味深く価値のある革新的なアプリケーションの実装に努めます。 |
<<: 大型模型+ロボット、詳細なレビューレポートはこちら、多くの中国の学者が参加
現代の CPU は、命令を順番に実行し、アルゴリズムを 1 つずつロードされて実行される命令に分解し...
米国の研究チームは最近、ウェアラブルデバイスから得られる生体認証データを分析することで、一見健康そう...
近年、大規模言語モデル (LLM) とその基盤となるトランスフォーマー アーキテクチャは会話型 AI...
RNN とは何か、どこで使用されているか、どのように前方および後方に伝播するか、そして PyTorc...
[[323595]]機械学習とディープラーニングのアルゴリズムは、脳内のニューロンを結びつけるシナプ...
ディープラーニングは、データから段階的に優れた高度な洞察を抽出するために複数の処理層を活用する人工ニ...
この記事の著者は、AI テクノロジーが私たちの生活にもたらす利便性と、それが持つ限界について、4 つ...
自動化と生成型人工知能 (GenAI) の時代において、「データセンター」の本当の意味を再考する時が...
自動運転技術は人類社会の未来を変える科学技術であり、私たちの生活にどんどん浸透し、すでに多くの自動運...
新しい言語を学ぶことは間違いなく挑戦です。特に 18 歳以上の人にとっては、これまで触れたことのない...
近年、人工知能分野の発展はますます加熱し続けており、現在の人材不足が注目を集めています。国務院が20...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
画像マッティングとは、画像内の正確な前景を抽出することを指します。現在の自動方法では、画像内のすべて...
最近、アリババAIは常識QA分野の権威あるデータセットであるCommonsenseQAで新たな世界記...