この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 言語モデルは常に無関係な回答を出すため、これが最も批判されている問題の 1 つとなっています。 今、DeepMindは解決策を思いつきました—— モデルに人間のように「グーグル検索」を学習させ、質問に答え、議論を展開させます。 このモデルはGopherCiteと呼ばれ、次のように質問します。
答えは次のようになります:
DeepMindがこの研究を発表したページを引用しながら、答えの根拠も示されています。 そして、本当に理解できない質問に遭遇したときは、「わかりません」と言い、間違った答えを強制することはありません。 トレーニング結果によると、自然な質問データセットと ELI5 データセットでのモデルの精度率はそれぞれ90%と80%に達し、人間のレベルに近いことがわかりました。 強化学習を使用してAIにGoogle検索を訓練するまず、GopherCite の有効性を見てみましょう。 質問されたとき:
GopherCite は次のように返信しました:
議論を見つけることを学習した後、AI によって提供される回答がはるかに信頼できるものになることは容易にわかります。 実際、GopherCite の前身である超大規模言語モデル Gopher は、質問に答える際のパフォーマンスがはるかに悪かった。 Gopherは、DeepMind が昨年末にリリースした NLP モデルで、2,800 億個のパラメータが含まれています。 これは Transformer アーキテクチャに基づいており、10.5 TB の MassiveText コーパスでトレーニングされています。 ここで、DeepMind は説明のために例を挙げています。 Gopher と GopherCite が同じ質問に答えてみましょう。
ゴーファーは(間違って)答えました:
しかし、GopherCite は正しかった:
そして厳密な理由を述べた。
では、GopherCite はどのように機能するのでしょうか? 研究者たちは、Gopher をベースに、強化学習を使った報酬メカニズムを開発しました。 質問を受け取ると、モデルは Google Search API にアクセスして関連する Web ページを見つけ、上位 K 件の結果を取得します。 (トップ K 操作、つまり、スコアのセットから k 個の最大または最小の要素を見つけることは、機械学習モデルの重要なコンポーネントであり、情報検索やデータ マイニングで広く使用されています。) 次に、質問に基づいていくつかの回答が生成され、回答の数 N は K より大きくなります。 これらの回答には、Web で検索された回答を含むテキストである独自の証拠も付属します。 次に、システムはこれらの回答にスコアを付け、最終的に最高スコアの回答を出力します。 推論中、モデルのサンプリングはドキュメントを周期的に反復処理します。各サイクルでは、単一のドキュメントから可能な限り多くのコンテキストを表示し、テキストを並べ替えて前のステップに戻します。 さらに、モデルは最終的に生成された回答の品質を計算し、生成された回答の質が低すぎる場合は回答しないことを選択します。 これは、レッドブルのスローガン「それはあなたに翼を与える」に由来しています。 ELI5Filtered データセットの質問の 70% に回答すると、精度は約 80% になります。 DeepMind によれば、このトレーニング モードはLaMDAに多少似ているとのことです。 LaMDA は、昨年の I/O カンファレンスで Google が発表した会話モデルです。人間の指示を「理解」し、流暢に応答し、論理と事実が正しいことを確認できます。 違いは、LaMDA は質問を共有するための関連リンクを直接提供することがあるのに対し、GopherCite は関連する議論の文章を直接抽出できることです。 さらに、OpenAIは最近GPTのウェブ版を開発した。 (WebGPT) も同様の方法を使用して GPT-3 を調整します。 DeepMind によると、WebGPT は Web ページを複数回訪問することで回答を整理するのに対し、GopherCite は長いテキスト セグメントの読み取りに重点を置いているとのことです。 間違いは起こるだろう情報を引用する方法はわかっていますが、GopherCite ではそれを機械的に使用することがあります。 例えば、「レッドブルを飲むとどうなる?」と尋ねると、答えは「翼」です。 これは、レッドブルのスローガン「それはあなたに翼を与える」に由来しています。 どうやら比喩を理解させるのはまだ少し難しいようです... ネットユーザーの中には、人間が自分でGoogleで検索したほうが早いかもしれないと不満を言う人もいた。 どう思いますか? |
<<: MITのロボット犬がまた進化しました。砂利や氷の上でも滑らずに走れます。今回は本当に犬と同じくらい安定しています
>>: 184.3億ドルを突破! 「中国スピード」が人工知能の分野で再び出現
過去 10 年間で、機械学習への関心は爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエ...
[[233292]]最近、北京天壇病院は、世界初のCTおよびMRI神経画像人工知能支援診断製品「Bi...
知識の蓄積は規模の拡大をもたらし、規模の拡大は市場の集中につながります。産業が「組立ライン」の形で固...
ドイツ特派員 青木「昨年、北米のロボット受注の大半は初めて自動車工場で受注されなかった」ロイター通信...
[51CTO.com からのオリジナル記事] スマートカーといえば、真っ先に思い浮かぶのは自動運転で...
翻訳者 |ブガッティレビュー | Chonglou先週、 OpenAIチームは、物理世界の基本的な側...
今日、機械学習の可能性に関心を持つプログラマーは、人工知能と AI ベースのソフトウェア開発ツールを...
新世代人工知能の活発な発展は、科学技術革新と産業のアップグレードと変革の産業推進の焦点となり、経済社...
数週間前、Googleの人工知能(AI)子会社DeepMindが、Gato(同じトレーニング済みモデ...
技術革命への懸念私たちは技術革命を心配すべきでしょうか、それとも期待すべきでしょうか。一方では、技術...
GPT-4 が最近少し「怠惰」になっていることにお気づきでしょうか。現在、GPT-4 は常に特定のタ...