150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

過去 10 年間、データ サイエンスと機械学習の分野では驚異的な進歩が見られました。ディープラーニング手法の助けを借りて、多くの高次元学習タスク(コンピュータービジョンやタンパク質フォールディングなど)も適切なコンピューティング規模で完了できます。高次元空間における普遍的な関数の学習は非常に難しい問題ですが、ほとんどのタスクに対して方法は普遍的ではなく、物理世界の根底にある低次元性と構造には、いくつかの必要な事前定義された規則性が存在します。

グラフニューラルネットワークと幾何学的ディープラーニングにおける一連の最近の進歩は、機械学習がより詳細かつ複雑な問題を解決するのに役立つことが期待されています。

幾何学的ディープラーニングは、対称性と不変性の観点から一般化された機械学習の問題を幾何学的に統一する試みです。これらの原理は、畳み込みニューラル ネットワークの画期的なパフォーマンスとグラフ ニューラル ネットワークの最近の成功の基盤となっているだけでなく、問題固有の新しい帰納的バイアスを構築するための原理的なアプローチも提供します。

最近、「Geometric Deep Learning」というタイトルの新しい本が出版され、さまざまなアプリケーションに適用できる幾何学的統一原理を通じて規則性を明らかにしています。この「幾何学的統一」には 2 つの意味があります。一方では、CNN、RNN、GNN、Transformer などのニューラル ネットワーク アーキテクチャを研究するための一般的な数学的フレームワークを提供します。一方、これは、以前の物理的知識をニューラル アーキテクチャに統合するための構築的な手順を提供し、いくつかの新しいアーキテクチャを構築するための原理的な方法を提供します。

機械学習アーキテクチャの構築方法を教えます

「幾何学的ディープラーニング、グリッド、グループ、グラフ、測地線、ゲージ」は、ディープラーニング幾何学統合プロジェクトの最初のオンラインブックです。著者によると、この本は2020年2月に執筆を開始し、現在のバージョンは150ページを超えています。

この研究の著者4人、マイケル・M・ブロンスタイン、ジョアン・ブルーナ、タコ・コーエン、ペタル・ヴェリコビッチは、インペリアル・カレッジ・ロンドン、ニューヨーク大学、ディープマインドなどの研究機関に所属している。

リンク:
翻訳:

arXiv論文:
https://arxiv.org/abs/2104.13478

この本では、研究者は対称性、不変性、群論の観点から「一般的に使用されるすべてのニューラル アーキテクチャを構築するために必要な知識」を抽出しようとします。 CNN、GNN、Transformer、LSTM などの一般的に使用されるモデルに加えて、球状畳み込みニューラル ネットワーク (球状 CNN)、SO(3)-Transformer、ゲージ等変メッシュ CNN などの新しいモデルもカバーしています。

この本には、導入、高レベル空間での学習、幾何学的事前知識、幾何学的領域、幾何学的深層学習モデル、既存の問題とアプリケーション、歴史的展望の 7 つの章が含まれています。以下は書籍カタログです。

前提条件

「これまで群論に触れたことがない人にとって、私たちが構築する概念のいくつかは少々非現実的に思えるだろう」と、ディープマインドの上級研究科学者で本書の著者の一人、ペタル・ヴェリコビッチ氏は言う。

そのため、前置きとして著者同士の動画共有コンテンツをいくつか視聴すると、言葉では正確に表現できないコンテンツもより「鮮明」になるかもしれません。

ケンブリッジ大学でのペタル・ヴェリコビッチ氏の講演 - グラフニューラルネットワークの理論的基礎:
https://www.youtube.com/watch?v=uF53xsT7mjc

ICLR 2021におけるマイケル・ブロンスタインの基調講演:
https://iclr-conf.medium.com/announcement-the-iclr-2021-invited-speakers-db4aba84038a お知らせ

さらに、この本には次の概念が含まれています。

ドメイン: データを定義するすべての「ポイント」の集合。たとえば、画像の場合、ドメインはすべてのピクセルの集合です。グラフの場合、ドメインはすべてのノードとエッジの集合です。集合は無限または連続である可能性があることに注意してください。ただし、有限であると想像すると、計算が簡単になる場合があります。

対称群: 集合 Ω からそれ自身への全単射の集合 (g: Ω → Ω)。たとえば、画像内の各ピクセルを 1 スロット右にシフトしても、画像内のオブジェクトは変更されません。

対称変換を実行するときにオブジェクトが変更されないようにする必要があるため、次のプロパティが導入されます。

対称操作は構成可能である必要があります。たとえば、球を x 軸を中心に 30 度回転させ、次に y 軸を中心に 60 度回転させ、各回転で球上のオブジェクトが変更されないと仮定すると、複数の変換を連続して使用しても球上のオブジェクトは変更されません。つまり、x 軸を中心に 30 度回転させ、次に y 軸を中心に 60 度回転させることも対称操作になります。一般に、g と h が対称操作である場合、goh も対称操作になります。

対称操作は可逆的でなければなりません。つまり、基になるオブジェクトを変更していない場合は、元の状態に戻れる必要があります (そうでない場合は、情報が失われることになります)。したがって、球体を時計回りに 30 度回転させた場合、反時計回りに 30 度回転させることによって元のアクションを「元に戻す」ことができます。 g が対称である場合、g^-1 が存在する必要があります (また対称でなければなりません)。これにより、gog^-1 = id (同一性) になります。

ドメイン保存アイデンティティ関数 (id) も対称である必要があります。

これらの特性をすべて足し合わせると、すべての対称集合と結合演算子 (o) がグループを形成し、それが本書で広く使用されている数学的構造であることがわかります。

対称性の重要性は、機械学習コミュニティ、特にパターン認識とコンピューター ビジョン アプリケーションにおいて長い間認識されてきました。等価特徴検出に関する初期の研究は、前世紀の天利俊一とライナー レンツの研究にまで遡ることができます。ニューラル ネットワークの分野では、マービン ミンスキー氏とシーモア パパート氏によって提唱されたパーセプトロンの群不変性定理が、(単層) パーセプトロンが不変性を学習する能力の基本的な定義を提供します。これがその後の多層アーキテクチャの研究の出発点となり、最終的にはディープラーニングへとつながりました。

<<:  蔡子星院士:オープンソースは人工知能開発の新たなトレンド

>>:  ロボットがお手伝いします。楽しいメーデーを楽しみましょう!

ブログ    
ブログ    
ブログ    

推薦する

...

...

AIが継続的にモンスターと戦い、アップグレードできるようにするために、DeepMindは「メタバース」を作成した。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

AIによる顔の変形の背後にある技術的な戦い

[[275567]]週末に集中的に流行した後、顔を変えるソフトウェアZAOの人気はようやく落ち着きを...

...

Facebook は、自社の成功の要因となったアルゴリズムをどうやって修正できるのでしょうか?

[[428596]]専門家はCNNに対し、フェイスブックのアルゴリズムは改善できる可能性があると語...

インタビュアー: アルゴリズムの時間計算量と空間計算量についてどう思いますか?計算方法は?

[[424483]] 1. はじめにアルゴリズムとは、データを操作し、プログラムの問題を解決するた...

...

英国で新たな自動運転規制が導入され、ドライバーはもはや「集中」する必要がなくなった

自動運転は近年市場で最も活発なトピックの1つです。資金が継続的に流入し、大手企業が存在感を示そうと競...

人工知能は私たちの生活をどのように変えるのでしょうか?

人工知能は本質的に、人間の知的労働を解放するでしょう。今後、サービスがボトルネックとなり、サービス産...

2019年自動車向け人工知能コンピューティング技術と市場動向

[[258319]]人工知能 (AI) は、私たちの毎日の通勤を含め、ゆっくりと、しかし確実に、より...

なぜRLの一般化は難しいのか:バークレーの博士が認知POMDPと暗黙の部分観測性から説明する

[[437395]]今日の強化学習 (RL) には、収束性が低いなど多くの問題があります。比較的弱い...

人工知能による影の検出と除去、反射に基づく影の検出と除去方法を実現

AI による影の検出と除去、反射ベースの影の検出と除去方法に向けて、概要: 影は画像によく見られる要...

鍾南山氏は人工知能カンファレンスでAI COVID-19画像認識などの技術について講演した。

現在、世界の健康は大きな課題に直面しています。2020年以降の新型コロナウイルスの蔓延は、世界的な公...

AI を理解する: 人工知能システムで説明可能性を追求する理由

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...