チューリング賞受賞者のベンジオが新論文を発表、Redditがクラッシュ: アイデアがクラッシュ

チューリング賞受賞者のベンジオが新論文を発表、Redditがクラッシュ: アイデアがクラッシュ

[[403771]]

機械学習における重要な研究はモデルの一般化を改善することであり、モデルをトレーニングする際には、トレーニング セット データの分布がテスト セットの分布と同じであるという仮定が立てられます。

しかし、モデルが直面する入力データは現実世界から来ており、不安定で進化しており、データの分布は環境に応じて変化します。

この問題は人間にとっては非常に簡単に解決できますが、例えばインターネットスラングは無数にあり、誰もがすぐに受け入れて上手に使うことができますが、機械にとっては難しいのです。

人間は、関連する事前知識を再利用することで、新しい知識を素早く適応させ、学習することができます。この考え方を機械学習モデルに適用する場合、まず、知識を簡単に再結合可能なモジュールに分割し、これらのモジュールを変更または組み合わせて新しいタスクやデータ分布のモデリングを実現する方法を理解する必要があります。

この問題に基づいて、チューリング賞受賞者のヨシュア・ベンジオ氏は最近 arxiv に論文を発表し、互いに競合し、キー値アテンション メカニズムを使用して関連する知識を見つける一連の独立したモジュールで構成されるモジュール アーキテクチャを提案しました。研究者らは、モジュールと注意機構パラメータにメタ学習アプローチを適用し、強化学習方式で分布の変化や新しいタスクへの迅速な適応を実現しました。

研究チームは、このようなモジュール式アーキテクチャが知識を不変かつ再利用可能な部分に分解し、結果として得られるモデルがよりサンプル効率が高くなるだけでなく、さまざまなタスク分布にわたって一般化できるかどうかを調査しました。

このモデルは、独立したモジュールと競合するモジュールのセットで構成される再帰型独立メカニズム (RIM) アーキテクチャに基づいています。この設定では、各モジュールは独立して動作し、注意を通じて他のモジュールと対話します。異なるモジュールは入力アテンションを介して入力の異なる部分を処理し、モジュール間のコンテキスト関係は通信アテンションを介して確立されます。

研究者らはまた、メタ学習を使用してネットワークのさまざまなコンポーネントをさまざまな速度とさまざまな時間スケールでトレーニングし、基礎となる分布の急速に変化する側面とゆっくりと変化する側面の両方を捉える方法を示しました。

したがって、モデルには高速学習フェーズと低速学習フェーズの両方があります。

高速学習では、アクティブ化されたモジュールのパラメータが迅速に更新され、タスク分布の変化を捉えます。

低速学習では、タスク分布のより安定した側面を捉えるために、これら 2 つの注意メカニズムのパラメータはより低い頻度で更新されます。

チームは、MiniGrid および BabyAI スイートのさまざまな環境で、提案された Meta-RIM ネットワークを評価しました。彼らは平均返品率と平均成功率を指標として選択し、Meta-RIMs ネットワークを 2 つのベースライン モデル (Vanilla LSTM モデルとモジュラー ネットワーク) と比較しました。

結果は、提案されたアプローチによりサンプル効率が向上し、トレーニング分布の体系的な変化に対してより適切に一般化されるポリシーにつながることを示しています。

さらに、このアプローチでは、以前に学習した同様のタスクから得た知識を再利用して強化学習エージェントを段階的にトレーニングすることで、新しいリリースへの適応が速くなり、知識学習が向上します。

この研究では、モジュール構造におけるメタ学習とスパース通信をうまく活用して、基礎となるメカニズムの短期的側面と長期的側面の両方を捉え、メタ学習と注意に基づくモジュール性によってサンプル効率、分布外一般化、転移学習が向上することを確認しました。

Redditユーザーのアイデアが衝突?

論文が発表されるとすぐに、Reddit上で白熱した議論が巻き起こった。

ある男性は、とても腹が立ったとコメントしました。彼は、これを4年間続けてきて、今年中に出版するつもりだったのに、まだ追い抜かれてしまったと言いました。後に、まったく同じ仕事ではないが、非常に近い仕事だったと付け加えた。

これにより、異なる方法から同様の結論が得られる可能性があり、それぞれの方法に価値があるという無数の安心感も得られます。

一部のネットユーザーは、あなたの強さはすでにベンジオと彼のチームに匹敵すると考えています。それは良いことです!そして、同じことについて自分とは異なる考えを持つ人がいると、刺激を受けて自分の仕事が促進されるかもしれません。

知乎の一部ネットユーザーもこれについて疑問を呈した。

一部のネットユーザーからは、2つの論文が衝突し、履歴書が誇張しすぎているとの意見が出ている。自分の書いた論文が大物の上司の論文と衝突した場合、相手の論文が完璧であるため、抵抗する余地はない。機会があれば、穴を埋めるのではなく、穴を掘らなければなりません。

現在、一部のディープラーニングの研究は、手作業のスピードが課題となるところまで来ています。BERTが登場すると、BERTをベースにしたさまざまな研究が次々と登場しました。これは単なる検証研究であり、同業者に何のインスピレーションも与えることはできません。

結局のところ、ニュートンとライプニッツは微積分についてまだ議論していたし、一般の人々が自動車事故を起こすのは普通のことだった。

紙の事故に遭ったことはありますか?

<<:  データが増えるほど、AI は賢くなるのでしょうか?私たちはそれを常に当然のこととして受け止めてきました。

>>:  製造、小売、医療の事例から:エッジコンピューティングと人工知能がどのように収益向上に役立つか

ブログ    

推薦する

...

アルファベットのウィングがドローン配達サービスをダラス・フォートワース地域に導入

ドローンはまもなく、タイレノールとバンドエイドが詰まった小型容器を積んでダラス・フォートワース上空を...

...

Baidu CTO 王海鋒氏のCNCC2019講演: ディープラーニングプラットフォームが産業インテリジェンスをサポート

10月17日から19日まで、2019年中国コンピュータカンファレンス(CNCC2019)が蘇州で開催...

自動運転車の4つの重要な要素:2040年までに市場価値500億ドル

自動運転車は自動車業界にとって非常に破壊的な技術です。現在、多くのメーカーが物流、自動運転タクシー、...

...

多関節ロボットの主な分類、利点、欠点は何ですか?

多関節ロボットは、多関節アームロボットまたは多関節ロボットアームとも呼ばれ、今日の産業分野で最も一般...

調査によると、ChatGPTが提供するアドバイスは専門家が提供するアドバイスよりも包括的で役立つことがわかっています。

12月26日、専門家が実施した最近の調査では、ChatGPTが提供する提案は、人間の専門家が提供す...

うつ病で人生が押​​しつぶされたとき、AIを使ってうつ病を診断することで、どん底を味わう人々を救えるのでしょうか?

韓国のお笑いタレント、パク・チソンさんとその母親が自宅で死亡しているのが発見されたが、これはうつ病が...

人工知能はこれからどのように発展していくのでしょうか?

人工知能、略してAIの起源は非常に古い。1956年の夏、アメリカのハノーバーという小さな町に、コンピ...

産業AI戦略を成功させる3つの鍵

今日、工業製造業は産業用人工知能への依存度が高まっており、業務上の意思決定者はこれをデジタル変革戦略...

アンビエントコンピューティングが次の大きなトレンドになる理由

アンビエント コンピューティングとは、テクノロジーが環境にシームレスに溶け込み、日常生活に浸透する世...

Baidu がカスタマイズされたトレーニングおよびサービス プラットフォーム EasyDL を全面公開: 誰もが AI を使えるように

百度は昨年7月にAIプラットフォームをオープンして以来、開発者にAIオープンテクノロジーの能力を継続...

AIをやりたいなら高校でデータサイエンスを勉強するな:ウルトラマンとマスクがついに合意

AIの発展には基礎教育を強化しなければ手遅れになります。大規模モデル技術が急速に発展し、企業間の競争...

[探索] 機械学習モデルのトレーニングをサポートする 8 つの JavaScript フレームワーク

[[221813]] [51CTO.com クイック翻訳] JavaScript 開発者は、さまざま...