今年の機械学習研究で最もホットな分野は何ですか?幾何学的ディープラーニングの最大の勝者、Redditは混乱に陥っている

今年の機械学習研究で最もホットな分野は何ですか?幾何学的ディープラーニングの最大の勝者、Redditは混乱に陥っている

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

今年の機械学習の注目研究は何でしょうか?

最近、あるネットユーザーがRedditでそのようなディスクを公開し、すぐに多数のMLerの注目を集めました。

自己教師ありモデルを推奨する人もいれば、表現学習がますます注目を集めていると考える人もいれば、物理ベースの機械学習が将来の方向性であると考える人もいます...

しかし、コメント欄の「いいね!」数の高さから判断すると、上記の方向性はどれも「勝者」ではないようです。

これまでのところ、最も多くの「いいね!」を獲得している出場者は、Geometric Deep Learning です。

この技術が世間の注目を集めるようになったのは、Twitterの主任科学者でグラフ機械学習の専門家であるマイケル・ブロンスタイン氏が昨年発表した論文によるものだ。

(ちなみに、その論文は160ページあります)

そこで質問です:

Top の人気はどこから来るのでしょうか?

幾何学的ディープラーニングの正式名称は Geometric Deep Learning で、2016 年に Michael Bronstein 氏が論文で初めて紹介しました。

簡単に言えば、CNN、GNN、LSTM、Transformer などの代表的なアーキテクチャを対称性と不変性の観点から幾何学的に統一しようとするアプローチです。

高く評価されたコメントの下に、誰かがこの「対称性」を簡単な例で説明していました。

従来のネットワークでは、「E」と「3」は異なるものとみなされますが、鏡映対称性 (またはπ結合回転) を備えたネットワークでは、それらは一貫しているものとみなされます。

これが CNN が行うことです。不変性が変換可能 (または変換可能) になると、右上隅の 3 つと中央の 3 つは当然同じになります。私たちは、CNN のこの特性を他のアーキテクチャに「拡張」したいと考えています。

これが対称性によってもたらされる安定性です。視覚的に見ると、多くのオブジェクトは実際には同じオブジェクトです。それらは「これは同じオブジェクトですが、反転しているだけです」という 3D 幾何学的類似性を持っています。したがって、対称性に基づいて多くの問題を解決できます。

従来の畳み込みネットワークでは、この目的を補うために、回転、平行移動、反転などのより多くのデータ拡張を使用します。

そのため、幾何学的ディープラーニングでは、幾何学における「不変群」の概念の範囲を拡大し、従来の回転対称性や並進対称性の操作に加えて、「不変性」などの操作をネットワークに含めることができるようにしたいと考えています。

たとえば、ビデオでは 2 台の車が互いに向かって走っています。速度や障害物の有無に関係なく、ビデオの意味論では 2 台の車が互いに向かって走っていることになります。

一般的に、幾何学的ディープラーニングは、畳み込みネットワークをより安定させるだけでなく、爆発的に複雑化するフィッティング関数にもより適切に対処できます。

その他の人気ノミネート

人気の幾何学的ディープラーニングに加え、私たちがよく知る手法も数多くノミネートされています。

たとえば、コメント欄で最も多く言及された「人気のある選択肢」は、自己教師学習です。

教師あり学習は現在、機械学習の分野で主流の手法ですが、新しい学習手法である自己教師あり学習は、入力データ自体を教師信号として使用し、ラベルなしデータから情報表現を学習します。これは、ほぼすべての異なるタイプの下流タスクに役立ちます。

これは、画像分類や言語翻訳など、多くの CV および NLP 分野のいたるところで見られ、LeCun は常にこの研究の方向性を強く支持してきました。

△ルカン2018スピーチ

また、表現学習と解釈可能性が  (解釈可能性)はますます注目を集めています。

彼はまず、理論的なディープラーニングの分野が「標準的な」問題(深さと幅、近似理論、ダイナミクスなど)からより抽象的な問題へと移行しつつあるように見えるため、表現学習を指名したと説明した。

たとえば、良い表現とは何でしょうか?表現のどのプロパティが重要ですか?この概念を数学的に定義するにはどうすればよいでしょうか?どのように施行するのでしょうか?

解釈可能性は表現学習にも関連しています。つまり、優れた表現とは何かを理解し、それにプロパティを課すことができれば、より解釈しやすくなります。

指名検索、強化学習に適用される転移学習、大規模言語モデルにおけるマルチモーダルおよび嗜好学習もあります。

ここでの「検索」とは、DeepMind による最近の実験のように、外部データセットから情報を取得することを指します。

ポスターでは、検索はロングテール問題の解決にも使用できるとも述べられています。

興味深いことに、コメント欄で誰かが「量子機械学習」を挙げ、物理学者がAI研究者に真摯な質問を投げかけました。

これは本当に役に立つものでしょうか、それとも単なる民間科学なのでしょうか?

実際、2017年にチューリング賞を受賞した姚其志氏はスピーチの中で「量子コンピューティングとAIを組み合わせることができれば、自然界でさえ考えつかなかったことが可能になるかもしれない」と述べた。

これは、量子コンピューティングと機械学習が交差する学際的な技術分野です。量子の特性を利用して高性能な量子機械学習アルゴリズムを開発し、人工知能の応用シナリオを加速または拡大します。

しかし、まだ広く使用されているアプリケーションはないため、投稿者は慎重に返信しました。「わかりませんが、これは機械学習の最新のトレンドだと多くの人が言っています...」

コメント欄では、おなじみの拡散モデル、連合学習、微分アルゴリズム、メタ学習についても言及されていました。

今年の終わりには、過去をもう一度掘り起こして、本当に賞を受賞した候補者がいるかどうかを確認できるでしょう。

<<:  メタ「世界モデル」が疑問視される:それは 10 年前に存在していた!ルカン:重要なのは構築とトレーニングです

>>:  調査によると、米国の公共部門のIT意思決定者の70%にとってAIは「ミッションクリティカル」

ブログ    
ブログ    

推薦する

7つの予測ストレージ分析ツールの比較

人工知能技術は、機械学習、計算統計、さまざまなディープラーニングモデルの使用を通じて主流になりました...

TensorFlow2を使用して細胞画像が感染しているかどうかを判断する方法を教えます

[[405128]]このチュートリアルでは、TensorFlow (Keras API) を使用して...

水に溶けるロボットを見たことがありますか?ゼラチンと砂糖の3Dプリント

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能は「馴染みのものを殺す」ツールになるのでしょうか?

長い間、私の携帯電話のパッケージには主に 400 分の通話時間 + 500M のネットワーク トラフ...

...

人工知能は私たちに取って代わるのでしょうか?科学者たちは十分な証拠を提示しているが、その日が来るのはまだ遠い。

人工知能といえば、これは現代社会の最新の産物であり、この産物もまた最速のスピードで人間を駆逐していま...

AIが「軍事顧問」に?まずはRedditユーザーを獲得しよう

[[322491]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

世界初の電動ロボットが「宙返り」を練習し、ボストン・ダイナミクス・アトラスに挑戦!コーヒーアートも作れます。

2017年、ボストン・ダイナミクス社の人型ロボット「アトラス」が宙返りをするシーンが世界を驚かせた...

2020 年の優れた産業用人工知能アプリケーション

人工知能技術は今、世界を変えつつあります。多くの業界はすでに、ビジネス プロセスを改善するために A...

...

APPは顔認識を強制しますか?アカウントをキャンセルできませんか?国は行動を起こしている

現在、インターネット上では個人のプライバシー情報の漏洩が頻繁に発生しています。アプリは多くの場合、ユ...

Didiは最初の試みで惨敗した。自動運転は本当に良い市場なのか?

道路交通は常に人々の関心事であり、テクノロジーの時代において、人々は自動運転に大きな期待を寄せていま...

研究によると、ChatGPT は科学的仮説の偽のデータセットを生成し、学術的誠実性に脅威を与える可能性がある。

ネイチャー誌は11月24日、現地時間水曜日に、今月初めに米国医師会眼科学会誌に掲載された論文で、著者...

2020~2030年:人工知能が主流となる10年

ロボット工学者でありSF作家でもあるアイザック・アシモフは、小説『ロボット』(1950年)の中で、2...