ついに、私は物語を作るのをやめました！ AIが「グーグル」を学習、Q&Aの精度は90%

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

言語モデルは常に無関係な回答を出すため、これが最も批判されている問題の 1 つとなっています。

今、DeepMindは解決策を思いつきました——

モデルに人間のように「グーグル検索」を学習させ、質問に答え、議論を展開させます。

このモデルはGopherCiteと呼ばれ、次のように質問します。

GopherCite はどのようにして議論のソースを見つけるのでしょうか?

答えは次のようになります:

Google 検索を通じて関連するドキュメントを取得します。

DeepMindがこの研究を発表したページを引用しながら、答えの根拠も示されています。

そして、本当に理解できない質問に遭遇したときは、「わかりません」と言い、間違った答えを強制することはありません。

トレーニング結果によると、自然な質問データセットと ELI5 データセットでのモデルの精度率はそれぞれ90%と80%に達し、人間のレベルに近いことがわかりました。

強化学習を使用してAIにGoogle検索を訓練する

まず、GopherCite の有効性を見てみましょう。

質問されたとき:

スクービー・ドゥーで、スクービーはどんな動物ですか?

GopherCite は次のように返信しました:

グレートデーン。
Wikipedia スクービー・ドゥーより。これは、土曜日の朝に放映されたティーン向けアニメシリーズで、フレッド・ジョーンズや、しゃべるグレート・デーン犬のスクービー・ドゥーなどのキャラクターが主役です。

議論を見つけることを学習した後、AI によって提供される回答がはるかに信頼できるものになることは容易にわかります。

実際、GopherCite の前身である超大規模言語モデル Gopher は、質問に答える際のパフォーマンスがはるかに悪かった。

Gopherは、DeepMind が昨年末にリリースした NLP モデルで、2,800 億個のパラメータが含まれています。

これは Transformer アーキテクチャに基づいており、10.5 TB の MassiveText コーパスでトレーニングされています。

ここで、DeepMind は説明のために例を挙げています。

Gopher と GopherCite が同じ質問に答えてみましょう。

レークプラシッドでは冬季オリンピックが何回開催されましたか?

ゴーファーは（間違って）答えました:

レークプラシッドでは1932年、1936年、1980年に冬季オリンピックが開催されました。

しかし、GopherCite は正しかった:

二度。

そして厳密な理由を述べた。

オリンピック開催都市の歴史から引用。冬季オリンピックは1932年と1980年にレークプラシッドで開催され、夏季オリンピックは1936年と1984年にロサンゼルスで開催されました。

では、GopherCite はどのように機能するのでしょうか?

研究者たちは、Gopher をベースに、強化学習を使った報酬メカニズムを開発しました。

質問を受け取ると、モデルは Google Search API にアクセスして関連する Web ページを見つけ、上位 K 件の結果を取得します。

(トップ K 操作、つまり、スコアのセットから k 個の最大または最小の要素を見つけることは、機械学習モデルの重要なコンポーネントであり、情報検索やデータマイニングで広く使用されています。)

次に、質問に基づいていくつかの回答が生成され、回答の数 N は K より大きくなります。

これらの回答には、Web で検索された回答を含むテキストである独自の証拠も付属します。

次に、システムはこれらの回答にスコアを付け、最終的に最高スコアの回答を出力します。

推論中、モデルのサンプリングはドキュメントを周期的に反復処理します。各サイクルでは、単一のドキュメントから可能な限り多くのコンテキストを表示し、テキストを並べ替えて前のステップに戻します。

さらに、モデルは最終的に生成された回答の品質を計算し、生成された回答の質が低すぎる場合は回答しないことを選択します。

これは、レッドブルのスローガン「それはあなたに翼を与える」に由来しています。

ELI5Filtered データセットの質問の 70% に回答すると、精度は約 80% になります。

DeepMind によれば、このトレーニングモードはLaMDAに多少似ているとのことです。

LaMDA は、昨年の I/O カンファレンスで Google が発表した会話モデルです。人間の指示を「理解」し、流暢に応答し、論理と事実が正しいことを確認できます。

違いは、LaMDA は質問を共有するための関連リンクを直接提供することがあるのに対し、GopherCite は関連する議論の文章を直接抽出できることです。

さらに、OpenAIは最近GPTのウェブ版を開発した。 (WebGPT) も同様の方法を使用して GPT-3 を調整します。

DeepMind によると、WebGPT は Web ページを複数回訪問することで回答を整理するのに対し、GopherCite は長いテキストセグメントの読み取りに重点を置いているとのことです。

間違いは起こるだろう

情報を引用する方法はわかっていますが、GopherCite ではそれを機械的に使用することがあります。

例えば、「レッドブルを飲むとどうなる？」と尋ねると、答えは「翼」です。

これは、レッドブルのスローガン「それはあなたに翼を与える」に由来しています。

どうやら比喩を理解させるのはまだ少し難しいようです...

ネットユーザーの中には、人間が自分でGoogleで検索したほうが早いかもしれないと不満を言う人もいた。

どう思いますか？

<<: MITのロボット犬がまた進化しました。砂利や氷の上でも滑らずに走れます。今回は本当に犬と同じくらい安定しています

>>: 184.3億ドルを突破！「中国スピード」が人工知能の分野で再び出現

OpenAIの初の開発者会議が事前に「公開」され、新しいChatGPTプロトタイプGizmoが公開された

ブログ

マッキンゼーのレポート: 2030 年までに 8 億人が機械に置き換えられ、約 1 億人の中国人が転職を余儀なくされる!

ブログ

ニューラルネットワークの層とノードの数を設定する方法

ブログ

消費者がリアルなAIを信頼しない理由

ブログ

人工知能を迷わせない

ブログ

シンプルで効率的なアルゴリズムが衛星IoTを現実に近づける

ブログ

EUはAI規制のルールを強化する計画で、最も厳しい法案を発表

ブログ

中国チームが超伝導において新たな大きな進歩を遂げました！ LK-99のような物質は、再現性と検証性を備えた超伝導性を示す。

ブログ

ついに、私は物語を作るのをやめました！ AIが「グーグル」を学習、Q&Aの精度は90%

強化学習を使用してAIにGoogle検索を訓練する

間違いは起こるだろう

OpenAIの初の開発者会議が事前に「公開」され、新しいChatGPTプロトタイプGizmoが公開された

マッキンゼーのレポート: 2030 年までに 8 億人が機械に置き換えられ、約 1 億人の中国人が転職を余儀なくされる!

ニューラルネットワークの層とノードの数を設定する方法

消費者がリアルなAIを信頼しない理由

人工知能を迷わせない

シンプルで効率的なアルゴリズムが衛星IoTを現実に近づける

EUはAI規制のルールを強化する計画で、最も厳しい法案を発表

中国チームが超伝導において新たな大きな進歩を遂げました！ LK-99のような物質は、再現性と検証性を備えた超伝導性を示す。

推薦する

顔認識技術の応用リスクと法的規制

AIは「メイおばさん」を見つけられるのか？

2021 年に注目すべき 27 の建設技術トレンド (パート 3)

2つのAIデートがネットワーク全体の注目を集めました。アルゴリズムがどれだけ強力であっても、失敗は免れません

OpenAI がリーダーを変更、アルトマン氏は退任！以前にも言いましたが、私は意思決定でよく間違いを犯します。

AIアーティストの彫刻作品が、カメラアイがスパイ活動に関与しているとの疑いで税関に押収された？

CPU、GPU、NPU、FPGA はディープラーニングでどのように優位性を発揮するのでしょうか?

Tフロントライン | テンセントAILabとの独占インタビュー：「点」から「線」へ、実験室は単なる実験以上のもの

リソース | ディープラーニングと機械学習の複数の知識ポイントを整理するのに役立つ 8 つのマインドマップ

ビッグデータとディープラーニングは、仕事帰りの交通渋滞の回避にどのように役立つのでしょうか?

大規模な言語モデルはデータアシスタントとして機能し、浙江大学のデータコパイロットはデータを効率的に呼び出し、処理し、視覚化します。

国内チームが新たなRLTFフレームワークを提案し、SOTAをリフレッシュしました！大規模なモデルはバグが少なく、より高品質なコードを生成します

運輸・物流業界におけるAIと自動化のユースケース