ジョークを見てみましょう。
このジョークは比較的単純なので、誰でもすぐに理解できるでしょう。これは単に「幸せな時間はいつもとても短く思える」という意味です。 しかし、ここで言及されている「クールな新しい言語モデル」が実際にこのジョークを理解できると想像できますか? 理解できるだけでなく、ジョークを真剣に説明することもできます。
この機能の背後には、ジョークを説明できる Google の新しいモデル、 Pathways Language Model (PaLM)があります。これにより、世の中に理解しにくいジョークはなくなるでしょう。 論文アドレス: https://arxiv.org/pdf/2204.02311v2.pdf 1 PaLM、5400億のパラメータで世界を理解しやすくするもちろん、PaLM が最初に設計されたとき、それは単にジョークを説明するためだけのものではありませんでした。 昨年、Google Research は、さまざまな分野やタスクに高い効率で一般化できる単一のモデルである PaLM のビジョンを発表しました。 論文「PaLM: Pathways による言語モデルのスケーリング」では、Google Research が 5,400 億のパラメータを持つ Transformer モデルである Pathways Language Model (PaLM) について詳しく説明しています。 PaLM を使用すると、複数の TPU v4 Pod にわたって単一のモデルを効率的にトレーニングできます。 Google Research は、数百の言語理解および生成タスクで PaLM を評価し、ほとんどのタスクで最先端の少数ショットのパフォーマンスを達成し、多くの場合で大きな利点があることを発見しました。 これには、ジョークのオチがどこにあるかを説明することも含まれます。 実際、ジョークを説明するのは簡単な作業ではありません。複数のステップから成る論理的推論、包括的な知識、深い言語理解の複雑な組み合わせを伴うシーンについて、明確な説明を生成する必要があります。 ただし、強力な言語処理機能のおかげで、PaLM はこのタスクに適しています。 下手なジョーク()でも、PaLM ならよく認識できます。たとえば、「シマウマと傘の違いは何ですか? 」と尋ねられたら、何か面白い答えが返ってくると期待するかもしれませんが、答えは「シマウマは馬に関連した縞模様の動物で、傘は雨が降るのを防ぐために使う道具です。 」です。 PaLM はこの無意味なジョークを次のように説明しました。
2 PaLMは絵文字から映画のタイトルを推測することもできますジョークを解釈する以外にも、PaLM は多くの非常に難しいタスクで画期的な能力を発揮します。 Google Research は、広く使用されている 29 の英語の自然言語処理 (NLP) タスクを評価しました。 PaLM 540B は、質問応答、穴埋めおよび文完成、Winograd スタイル、文脈読解、常識的推論、SuperGLUE、自然言語推論など、29 のタスクのうち 28 で、GLaM、GPT-3、Megatron-Turing NLG、Gopher、Chinchilla、LaMDA などの以前の大規模モデルよりも優れたパフォーマンスを発揮します。 PaLM は、英語の NLP タスクに加えて、学習コーパスの 22% のみが英語以外であるにもかかわらず、多言語 NLP ベンチマーク (翻訳を含む) でも優れたパフォーマンスを発揮します。 さらに、研究者らは、150 を超える新しい言語モデリング タスクを含む最近リリースされた「Beyond the Imitation Game Benchmark (BIG-bench)」で PaLM の機能を調査し、PaLM が画期的なパフォーマンスを達成したことを発見しました。 PaLM は、いくつかの BIG-bench タスクで優れた自然言語理解および生成機能を実証します。たとえば、このモデルは原因と結果を区別し、適切なコンテキストで概念の組み合わせを理解し、さらには絵文字から映画のタイトルを推測することもできます。 PaLM 開発の将来ビジョンについて、Google AI Blog はレポートの中で、「何千ものタスクを一般化し、さまざまな種類のデータを理解し、これらのタスクを並外れた効率で完了できる単一の人工知能システム」を実現したいと述べている。 |
<<: ネイチャー長文記事:AIのブラックボックスを破るための「長期戦」
>>: ディープラーニングはオイラー方程式を「破壊」する準備ができている
スマート製造ブームの到来により、設計、生産、管理、サービスなど、製造業のあらゆる側面に人工知能アプリ...
人工知能の急速な発展の背後には、大手メーカー間の秘密戦争の始まりがあります。誰もが開発者をめぐって競...
著者: 徐潔成最近、センセーショナルなAlphaGo囲碁ロボットを発売したDeepMindが再び大き...
ICML 2023 Test of Time Awards が発表されました!今年も、昨年同様、受賞...
記者がインタビューした専門家によると、人工知能などの知能化技術の応用が加速するにつれ、雇用への構造的...
データの処理と分析は基本的かつ広範囲にわたります。アルゴリズムはデータの処理と分析において重要な役割...
8月3日(東部時間8月2日)、Metaは、ユーザーがテキストプロンプトを通じて音楽やオーディオを作...
2019年もすでに半分が過ぎました。今年上半期のテクノロジー業界の目覚ましい成果は何でしょうか?今日...
[[313942]] [51CTO.com クイック翻訳] ご存知のとおり、ディープラーニングは人...
この記事では、データ サイエンティスト兼アナリストの Vincent Granville が、データ...