マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフトは11月15日、Google DeepMindのAlphaZeroにヒントを得て、コンパクトなニューラルネットワークを使用してAIモデルの推論機能を強化する「Everything of Thought」(XOT)と呼ばれる手法を発表した。

Microsoft、ジョージア工科大学、華東師範大学は協力して、強化学習とモンテカルロ木探索 (MCTS) 機能を統合し、複雑な意思決定環境における問題解決の有効性をさらに向上させるアルゴリズムを開発しました。

IT ホーム 注記: Microsoft の研究チームは、XOT メソッドにより言語モデルを未知の問題に拡張でき、Game of 24、8-Puzzle、Pocket Cube の厳密なテストで明らかな改善が見られると述べました。結果は、XOT が他の方法よりも大幅に優れており、他の方法では解決できない問題も解決できることを示しています。ただし、XOT は 100% の信頼性を達成するわけではありません。

XOT フレームワークには、次の主要なステップが含まれます。

  • 事前トレーニング フェーズ: MCTS モジュールは、効果的なマインド サーチに関するドメイン知識を学習するために、特定のタスクで事前トレーニングされます。軽量なポリシーと価値ネットワークが検索をガイドします。アイデア検索: 推論中に、事前トレーニング済みの MCTS モジュールはポリシー/値ネットワークを使用して、LLM のアイデアの軌跡を効率的に探索および生成します。
  • 思考の修正: LLM は MCTS の思考を確認し、エラーを特定します。修正されたアイデアは、追加の MCTS シミュレーションを通じて生成されます。
  • LLM 推論: LLM 問題解決の最終プロンプトに対して修正されたアイデアを提供します。

IT Homeでは、論文[PDF]のアドレスをここに添付していますので、興味のあるユーザーは詳しく読むことができます。

<<: 

>>:  IBM、スタートアップを支援するために5億ドルのエンタープライズAIベンチャーファンドを設立

ブログ    
ブログ    

推薦する

AI+ビデオ分析: ユビキタスセキュリティリスクのリアルタイム監視

[[352986]] 2020 年の多くの運用上の課題を踏まえて、公益事業会社は、運用する物理的およ...

Java から MySQL に接続するためのベストプラクティスを解読: 自分に合った方法を選択する

MySQL への接続は、Java 開発において非常に一般的なタスクの 1 つです。次のセクションでは...

データが少ないとディープラーニングは使えないなんて誰が言ったのでしょうか?私はこのことについて責任を負わないよ!

ある観点から見ると、激しい競争は業界の人気を示しています。最近、人気のディープラーニングも論争を引き...

人工知能はマーケティング業界に破壊的な影響を及ぼすだろう

ビッグデータと人工知能の市場は現在、活況を呈しています。調査会社の最近の予測によると、これら2つの技...

...

ハッシュアルゴリズムに基づくMySQLテーブルパーティション

以下に紹介する Mysql テーブルのパーティショニング プロセスは、ハッシュ アルゴリズムに基づい...

順序保存回帰: リソース利用を最大化するアルゴリズム

[[205069]] 1. 数学的な定義順序保存回帰は回帰アルゴリズムの一種です。基本的な考え方は、...

人工知能は日常のビジネス業務をどのように変えるのでしょうか?

「人工知能」という言葉を聞くと、まず頭に浮かぶのは「スマートデバイス/スマートシステム」です。しか...

Java プログラミング スキル - データ構造とアルゴリズム「ソート アルゴリズムの分類と紹介」

導入ソートとは、データのセットを指定された順序で並べるプロセスです。分類カテゴリ内部ソート: ソート...

資金調達は引き続き好調:6月の自動運転分野における資金調達活動の概要

近年、自動運転の開発が本格化し、多くの企業や資本が参入しています。こうした背景から、もうすぐ終わる6...

2018 年の 15 大テクノロジー トレンド、テクノロジーに関して正しい方向に進んでいますか?

[[216696]]一般的に言えば、未来そのものを予測することは難しいため、技術動向を明確に予測す...

長いテキストの復号化畳み込みニューラルネットワークアーキテクチャ

導入まず正直に言うと、しばらくの間、私はディープラーニングをあまり理解できませんでした。関連する研究...

...

現在のディープニューラルネットワークモデルの圧縮と加速方法の概要

[[208162]]大規模なニューラル ネットワークには多数のレイヤーとノードがあるため、特にオンラ...

出勤初日、AIバーチャル天気予報キャスターがレポートを担当。冬季オリンピックの裏側にあるAIブラックテクノロジーを振り返る

表紙ニュース記者 孟美 張悦希休日明けの初日、北京冬季オリンピックも競技3日目に入った。スタジアム内...