マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフトは11月15日、Google DeepMindのAlphaZeroにヒントを得て、コンパクトなニューラルネットワークを使用してAIモデルの推論機能を強化する「Everything of Thought」(XOT)と呼ばれる手法を発表した。

Microsoft、ジョージア工科大学、華東師範大学は協力して、強化学習とモンテカルロ木探索 (MCTS) 機能を統合し、複雑な意思決定環境における問題解決の有効性をさらに向上させるアルゴリズムを開発しました。

IT ホーム 注記: Microsoft の研究チームは、XOT メソッドにより言語モデルを未知の問題に拡張でき、Game of 24、8-Puzzle、Pocket Cube の厳密なテストで明らかな改善が見られると述べました。結果は、XOT が他の方法よりも大幅に優れており、他の方法では解決できない問題も解決できることを示しています。ただし、XOT は 100% の信頼性を達成するわけではありません。

XOT フレームワークには、次の主要なステップが含まれます。

  • 事前トレーニング フェーズ: MCTS モジュールは、効果的なマインド サーチに関するドメイン知識を学習するために、特定のタスクで事前トレーニングされます。軽量なポリシーと価値ネットワークが検索をガイドします。アイデア検索: 推論中に、事前トレーニング済みの MCTS モジュールはポリシー/値ネットワークを使用して、LLM のアイデアの軌跡を効率的に探索および生成します。
  • 思考の修正: LLM は MCTS の思考を確認し、エラーを特定します。修正されたアイデアは、追加の MCTS シミュレーションを通じて生成されます。
  • LLM 推論: LLM 問題解決の最終プロンプトに対して修正されたアイデアを提供します。

IT Homeでは、論文[PDF]のアドレスをここに添付していますので、興味のあるユーザーは詳しく読むことができます。

<<: 

>>:  IBM、スタートアップを支援するために5億ドルのエンタープライズAIベンチャーファンドを設立

ブログ    
ブログ    

推薦する

研究により機械学習のバックドア問題が発見される

翻訳者 | 李睿校正:孫淑娟第三者が機械学習モデルを提供し、そこに悪意のあるバックドアを密かに埋め込...

堅牢な機械学習アルゴリズムの構築方法: ブースティングとバギング

[[211376]]機械学習とデータサイエンスの作業は、単にデータを Python ライブラリに渡し...

ドライバーの状態行動を識別できる監視システムは、実際には十分に正確で信頼できるものではない

ドライバーモニタリングシステム(DMS)は、近年、自動車市場で注目を集めています。 DMS の出現に...

AIが臨床試験でスムーズな患者マッチングを実現する方法

新型コロナウイルス感染症のパンデミックは、がんとの戦いにおいて医療界に重要な教訓を浮き彫りにした。そ...

LLM にとってベクター データベースが重要なのはなぜですか?

翻訳者 |ブガッティレビュー | Chonglou Twitter 、 LinkedIn 、またはニ...

JVMシリーズ(3):GCアルゴリズムガベージコレクター

[[204469]]概要ガベージコレクションは、通常「GC」と呼ばれます。1960年にMITのLis...

脳卒中の診断と治療を加速させるAIの登場

ディープラーニングは人工知能の一種です。医療分野では、CTスキャン画像を使用して脳の血液供給動脈の閉...

本当に良いものです!機械学習技術と市場の最強評価ガイド

【51CTO.comオリジナル記事】機械学習の特許は、2013 年から 2017 年の間に 34% ...

データ構造とアルゴリズムソート - 理解できないなら、私に相談してください

[[194165]]以下では、主にデータ構造の教科書で紹介されている「10 種類のソートアルゴリズム...

ロボットプログラムは人間のプログラマーのようにバグを修正する

[[247601]]プログラムにバグが含まれることは避けられず、バグを見つけて修正することはプログラ...

「顔の特徴による犯罪者の識別」という論文がNatureに掲載されるのでしょうか? 1,700人の科学者が共同で反対

1,700人の研究者が、Nature による AI 研究論文の出版をボイコットする請願書に署名した。...

詳細 | 自然言語処理におけるディープラーニング研究の概要: 基本概念から最先端の成果まで

[[181446]] 1. 自然言語処理入門自然言語処理 (NLP) とは、言語を処理または「理解」...

...