Google、AIが出力コンテンツの正しさを自己判断できるモデルトレーニングフレームワーク「ASPIRE」をリリース

Google、AIが出力コンテンツの正しさを自己判断できるモデルトレーニングフレームワーク「ASPIRE」をリリース

IT Homeは1月23日、Googleが最近、大規模言語モデル向けに特別に設計されたASPIREトレーニングフレームワークを紹介するプレスリリースを発行し、AIモデルの選択的予測機能を強化すると主張していると報じた。

Google は、現在の大規模言語モデルは自然言語理解とコンテンツ生成の分野で急速に発展しており、さまざまな革新的なアプリケーションの構築に使用されているが、リスクの高い意思決定の状況に適用するのはまだ不適切であると述べました。これは、モデルの予測が不確実で「幻覚」を含む可能性があるためです。そのため、Google は一連のモデルに「信頼性」メカニズムを導入した ASPIRE トレーニング フレームワークを開発しました。つまり、モデルは一連の回答を出力し、それぞれの回答には正しい確率スコアが付けられます

▲画像出典:Google プレスリリース(以下同)

技術的なレベルでは、IT Home は、トレーニング フレームワークが主に「特定のタスクの調整」、「回答のサンプリング」、「自己評価学習」の 3 つの段階に分かれていることに気付きました。

「タスク固有の調整」フェーズでは、基礎トレーニングを受けた大規模言語モデルに対して、モデルの予測能力の強化に重点を置いた詳細なトレーニングを実施します。研究者らは主にモデルに一連の調整可能なパラメータを導入し、特定のタスクのトレーニングデータセット上で事前トレーニング済みの言語モデルを微調整することで、モデルの予測性能を向上させ、モデルが特定の問題をより適切に解決できるようにしました。

2 つ目の段階は「回答のサンプリング」です。特定の微調整を行った後、モデルは以前に学習した調整可能なパラメータを使用して、トレーニングの質問ごとに異なる回答を生成し、自己評価学習用のデータセットを作成して、信頼性の高い一連の回答を生成できます。研究者らは、ビームサーチ法とルージュLアルゴリズムの両方を使用して回答の質を評価し、生成された回答とスコアをモデルに再入力して第3段階を開始しました

第3段階の「自己評価学習」では、研究者らはモデルの自己評価機能を向上させるために特別に設計された一連の調整可能なパラメータをモデルに追加しました。この段階の目標は、モデルが「出力回答の正確さを自ら判断する」ことを学習できるようにし、大規模言語モデルが回答を生成するときに、回答の正しい確率スコアも添付できるようにすることです。

Google の研究者は、CoQA、TriviaQA、SQuAD という 3 つの質問応答データセットを使用して、ASPIRE トレーニング フレームワークの結果を検証しました。「ASPIRE によって調整された小さな OPT-2.7B モデルは、より大きな OPT-30B モデルよりもはるかに優れたパフォーマンスを発揮する」と言われています。この実験の結果は、適切な調整を行うことで、小さな言語モデルでもいくつかのシナリオでは大きな言語モデルよりも優れたパフォーマンスを発揮できることも示しています。

研究者らは、 ASPIREフレームワークのトレーニングにより、大規模言語モデルの出力精度が大幅に向上し、さらに小規模なモデルでも微調整後に「正確で信頼性の高い」予測が可能になると結論付けました

<<: 

>>:  2024年のデータセンターのトレンド: より高温、より高密度、よりスマート

ブログ    
ブログ    

推薦する

...

人工知能にとって2019年は厄介な年だった。資金は必要だったが、使えるお金がなかったのだ。

2019年、中国の人工知能分野への投資・融資熱は大幅に低下し、取引量も急減した。恥ずかしいことに、...

...

海外メディア:将来のドローン配達は住宅デザインスタイルを変えるかもしれない

ウォール・ストリート・ジャーナルによると、将来的にはドローンの群れが近隣地域を飛び回り、食料品や食品...

機械学習では、いくつかの分類アルゴリズムが一般的に使用されています。適切なアルゴリズムを選択するにはどうすればよいでしょうか?

今日は、機械学習における一般的な分類アルゴリズム 6 つ (K 最近傍法、決定木、単純ベイズ、ロジス...

...

マイクロソフト、AIアシスタントCopilotを搭載したWindows 11のメジャーアップデートをリリース

11月1日(米国時間火曜日)、ソフトウェア大手マイクロソフトは、パソコン用OS「Windows 11...

RDA を使用してデータの問題を解決し、AIOps の実装を加速する方法

【51CTO.com クイック翻訳】ロボティックデータオートメーション (RDA) とは?ロボティッ...

このオープンソースプロジェクトは、Pytorchを使用して17の強化学習アルゴリズムを実装しています。

強化学習は過去 10 年間で大きな進歩を遂げ、現在ではさまざまな分野で最も人気のあるテクノロジーの ...

ニューラル放射線フィールドは「神経」を取り除き、3D効果の品質を低下させることなくトレーニング速度を100倍以上向上させます。

2020年、カリフォルニア大学バークレー校、Google、カリフォルニア大学サンディエゴ校の研究者...

新人機械学習エンジニアが犯しがちな6つの間違い

機械学習やデータサイエンスのプロジェクトに取り組む際に、初心者がよく犯す間違いにはどのようなものがあ...

チップ大手は、写真を撮ることよりも面白くないこれらの新しいAI技術を秘密裏に開発している

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

OpenAIを去った偉人カパシ氏は「教え始めた」。おなじみのミニコードスタイルのまま、新しいプロジェクトが日々増えている。

偉大なカルパシー氏はOpenAIを辞任し、当初は1週間の休暇を取ると脅していた。写真しかし、瞬く間に...

AI への移行: 6 月の AI 資金調達活動の概要

情報化時代において、人工知能は急速に社会の変化と発展を推進しています。世界中の研究機関、企業、大学が...