マイクロソフトは「間違いから学ぶ」モデルトレーニング方法を発表し、「人間の学習プロセスを模倣し、AIの推論能力を向上させる」ことができると主張している。

マイクロソフトは「間違いから学ぶ」モデルトレーニング方法を発表し、「人間の学習プロセスを模倣し、AIの推論能力を向上させる」ことができると主張している。

IT Homeは11月7日、マイクロソフトリサーチアジアが北京大学、西安交通大学などの大学と共同で「Learning from Mistake(LeMA)」と呼ばれるAIトレーニング方法を提案し、人間の知識学習のプロセスを模倣することでAIの推論能力を向上させることができると主張していると報じた。

現在、OpenAI GPT-4 や Google aLM-2 などの大規模言語モデルは、自然言語処理 (NLP) タスクや思考連鎖 (CoT) 推論の数学的問題タスクで優れたパフォーマンスを発揮しています。

しかし、LLaMA-2やBaichuan-2などの大規模なオープンソースモデルは、関連する問題に対処するために強化される必要があります。これらの大規模なオープンソース言語モデルの思考連鎖推論能力を向上させるために、研究チームはLeMA法を提案しました。このアプローチは主に「間違いから学ぶ」ことで人間の学習プロセスを模倣し、モデルの推論能力を向上させます

▲画像出典:関連論文

IT Homeは、研究者の手法は「誤った回答」と「修正された正解」を含むデータのペアを使用して、関連するモデルを微調整することだったことを発見した。関連データを取得するために、研究者は 5 つの異なる大規模言語モデル (LLaMA および GPT シリーズを含む) の誤った回答と推論プロセスを収集し、GPT-4 を「修正子」として使用して修正された回答を提供しました。

修正後の正解には、元の推論プロセスにおける誤った部分、元の推論プロセスにおける誤りの理由、そして正しい答えを得るために元の方法をどのように修正するかという 3 種類の情報が含まれていることが報告されています。

研究者らは、GSM8KとMATHを使用して、5つの大規模なオープンソースモデルでLeMaトレーニング方法の有効性をテストしました。その結果、改良されたLLaMA-2-70Bを例にとると、GSM8Kでの精度は83.5%と81.4%、MATHでは25.0%と23.6%でした。

研究者らは現在、LeMA の関連情報を GitHub で公開しています。興味のある方は、こちらをクリックしてご覧ください。

<<:  AGI(汎用人工知能)は数年のうちに実現されるでしょうか? 3つのテクノロジー大手が判決を下す

>>: 

ブログ    
ブログ    

推薦する

製造業における AI: 2023 年に知っておくべき 4 つのユースケース

多くの企業にとっての優先事項は、人間の労働者を AI に置き換えることではなく、人間の能力を増強し、...

Python で分類と回帰を組み合わせたニューラル ネットワーク モデル

[[406559]] Python 中国語コミュニティ (ID: python-china)一部の予...

プログラマーに必要ないくつかの一般的なソートおよび検索アルゴリズムの概要

序文最近、アルゴリズムの基礎を固めるために、アルゴリズムの本にある基本的なアルゴリズムをもう一度見直...

...

アリペイは65歳以上の高齢者が直接人間サービスを利用できる専用ホットラインを立ち上げた。

IT Homeは2月9日、「高齢者のデジタル適応力に関する調査報告」によると、スマートフォンを使用...

機械学習がオラクルのクラウドアプリケーション戦略の中核に

オラクルの会長兼最高技術責任者(CTO)ラリー・エリソンは本日、Oracle Fusion Clou...

人工知能の時代では、ロボットがあらゆる面で人間に取って代わっている

ロボットは私たちの都市生活を変えています。この記事では、交通、物流、検知、食品、安全の 5 つの側面...

...

クラッシュラマ2!マイクロソフトの13億パラメータphi-1.5は、単一のA100でトレーニングされ、SOTAを更新します

モデルが大きくなれば機能も増えるのでしょうか?しかし、そうではありません。最近、マイクロソフトの研究...

AI に役立つ 7 つの優れたオープンソース ツール

ビジネスニーズを予測するには、AI を活用し、研究開発を新たなレベルに引き上げる必要があります。この...

機械学習の問題に適した事前トレーニング済みモデルを選択する方法

[[264482]]この記事では転移学習とは何か、どのように使用するのかを簡単に紹介します。転移学習...

...

...

...