マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフトは11月15日、Google DeepMindのAlphaZeroにヒントを得て、コンパクトなニューラルネットワークを使用してAIモデルの推論機能を強化する「Everything of Thought」(XOT)と呼ばれる手法を発表した。

Microsoft、ジョージア工科大学、華東師範大学は協力して、強化学習とモンテカルロ木探索 (MCTS) 機能を統合し、複雑な意思決定環境における問題解決の有効性をさらに向上させるアルゴリズムを開発しました。

IT ホーム 注記: Microsoft の研究チームは、XOT メソッドにより言語モデルを未知の問題に拡張でき、Game of 24、8-Puzzle、Pocket Cube の厳密なテストで明らかな改善が見られると述べました。結果は、XOT が他の方法よりも大幅に優れており、他の方法では解決できない問題も解決できることを示しています。ただし、XOT は 100% の信頼性を達成するわけではありません。

XOT フレームワークには、次の主要なステップが含まれます。

  • 事前トレーニング フェーズ: MCTS モジュールは、効果的なマインド サーチに関するドメイン知識を学習するために、特定のタスクで事前トレーニングされます。軽量なポリシーと価値ネットワークが検索をガイドします。アイデア検索: 推論中に、事前トレーニング済みの MCTS モジュールはポリシー/値ネットワークを使用して、LLM のアイデアの軌跡を効率的に探索および生成します。
  • 思考の修正: LLM は MCTS の思考を確認し、エラーを特定します。修正されたアイデアは、追加の MCTS シミュレーションを通じて生成されます。
  • LLM 推論: LLM 問題解決の最終プロンプトに対して修正されたアイデアを提供します。

IT Homeでは、論文[PDF]のアドレスをここに添付していますので、興味のあるユーザーは詳しく読むことができます。

<<: 

>>:  IBM、スタートアップを支援するために5億ドルのエンタープライズAIベンチャーファンドを設立

ブログ    
ブログ    
ブログ    

推薦する

90年代以降は人工知能で年間数百万ドルを稼ぐ、Google、Microsoft、BATの給与リストが明らかに

年末には給与に関する議論が再び盛り上がる。昨日、馬化騰氏は抽選で従業員に30万元相当のテンセント株1...

...

アリババ、量子アルゴリズムとエラー訂正の探究をサポートする量子シミュレータ「Taizhang 2.0」をオープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

ロボットが宇宙飛行士に取って代わるでしょうか?この会社は『アバター』を宇宙に送りたい

地球上の仕事でロボットが人間に取って代わり、今ではロボットが宇宙に行って仕事をこなすようになっている...

...

NANDフラッシュメモリのウェアレベリングアルゴリズムの最適化

0. はじめに現在、ノートパソコン、スマートフォン、ソリッドステートドライブなどの新しい電子機器には...

自動運転のベテラン、UberのためにGoogleの機密文書14,000件を盗んだとして訴えられる

[[275279]]アンソニー・レヴァンドウスキーはシリコンバレーのスターエンジニアです。自動運転技...

...

...

製造業におけるロボット:脅威か、それともチャンスか?

過去10年間で製造業におけるロボットの使用が増加しています。先進オートメーション協会が最近発表した調...

自己注意メカニズムとは何ですか?

[[241487]]著者: キオン・キムマシンハートが編集参加者: Geek AI、Liu Xia...

業界丨2020年のインテリジェントウェーブを理解するには、BaiduとGoogleのAIの足跡から始める

2020年が過ぎました。順調で平和な生活を送ったか、非常に困難な生活を送ったかにかかわらず、私たちは...

人工知能ネットワークが教育に与える影響を探る

教育業界は、テクノロジーの継続的な進歩によって大きなパラダイムシフトを経験しています。人工知能(AI...