150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

過去 10 年間、データ サイエンスと機械学習の分野では驚異的な進歩が見られました。ディープラーニング手法の助けを借りて、多くの高次元学習タスク(コンピュータービジョンやタンパク質フォールディングなど)も適切なコンピューティング規模で完了できます。高次元空間における普遍的な関数の学習は非常に難しい問題ですが、ほとんどのタスクに対して方法は普遍的ではなく、物理世界の根底にある低次元性と構造には、いくつかの必要な事前定義された規則性が存在します。

グラフニューラルネットワークと幾何学的ディープラーニングにおける一連の最近の進歩は、機械学習がより詳細かつ複雑な問題を解決するのに役立つことが期待されています。

幾何学的ディープラーニングは、対称性と不変性の観点から一般化された機械学習の問題を幾何学的に統一する試みです。これらの原理は、畳み込みニューラル ネットワークの画期的なパフォーマンスとグラフ ニューラル ネットワークの最近の成功の基盤となっているだけでなく、問題固有の新しい帰納的バイアスを構築するための原理的なアプローチも提供します。

最近、「Geometric Deep Learning」というタイトルの新しい本が出版され、さまざまなアプリケーションに適用できる幾何学的統一原理を通じて規則性を明らかにしています。この「幾何学的統一」には 2 つの意味があります。一方では、CNN、RNN、GNN、Transformer などのニューラル ネットワーク アーキテクチャを研究するための一般的な数学的フレームワークを提供します。一方、これは、以前の物理的知識をニューラル アーキテクチャに統合するための構築的な手順を提供し、いくつかの新しいアーキテクチャを構築するための原理的な方法を提供します。

機械学習アーキテクチャの構築方法を教えます

「幾何学的ディープラーニング、グリッド、グループ、グラフ、測地線、ゲージ」は、ディープラーニング幾何学統合プロジェクトの最初のオンラインブックです。著者によると、この本は2020年2月に執筆を開始し、現在のバージョンは150ページを超えています。

この研究の著者4人、マイケル・M・ブロンスタイン、ジョアン・ブルーナ、タコ・コーエン、ペタル・ヴェリコビッチは、インペリアル・カレッジ・ロンドン、ニューヨーク大学、ディープマインドなどの研究機関に所属している。

リンク:
翻訳:

arXiv論文:
https://arxiv.org/abs/2104.13478

この本では、研究者は対称性、不変性、群論の観点から「一般的に使用されるすべてのニューラル アーキテクチャを構築するために必要な知識」を抽出しようとします。 CNN、GNN、Transformer、LSTM などの一般的に使用されるモデルに加えて、球状畳み込みニューラル ネットワーク (球状 CNN)、SO(3)-Transformer、ゲージ等変メッシュ CNN などの新しいモデルもカバーしています。

この本には、導入、高レベル空間での学習、幾何学的事前知識、幾何学的領域、幾何学的深層学習モデル、既存の問題とアプリケーション、歴史的展望の 7 つの章が含まれています。以下は書籍カタログです。

前提条件

「これまで群論に触れたことがない人にとって、私たちが構築する概念のいくつかは少々非現実的に思えるだろう」と、ディープマインドの上級研究科学者で本書の著者の一人、ペタル・ヴェリコビッチ氏は言う。

そのため、前置きとして著者同士の動画共有コンテンツをいくつか視聴すると、言葉では正確に表現できないコンテンツもより「鮮明」になるかもしれません。

ケンブリッジ大学でのペタル・ヴェリコビッチ氏の講演 - グラフニューラルネットワークの理論的基礎:
https://www.youtube.com/watch?v=uF53xsT7mjc

ICLR 2021におけるマイケル・ブロンスタインの基調講演:
https://iclr-conf.medium.com/announcement-the-iclr-2021-invited-speakers-db4aba84038a お知らせ

さらに、この本には次の概念が含まれています。

ドメイン: データを定義するすべての「ポイント」の集合。たとえば、画像の場合、ドメインはすべてのピクセルの集合です。グラフの場合、ドメインはすべてのノードとエッジの集合です。集合は無限または連続である可能性があることに注意してください。ただし、有限であると想像すると、計算が簡単になる場合があります。

対称群: 集合 Ω からそれ自身への全単射の集合 (g: Ω → Ω)。たとえば、画像内の各ピクセルを 1 スロット右にシフトしても、画像内のオブジェクトは変更されません。

対称変換を実行するときにオブジェクトが変更されないようにする必要があるため、次のプロパティが導入されます。

対称操作は構成可能である必要があります。たとえば、球を x 軸を中心に 30 度回転させ、次に y 軸を中心に 60 度回転させ、各回転で球上のオブジェクトが変更されないと仮定すると、複数の変換を連続して使用しても球上のオブジェクトは変更されません。つまり、x 軸を中心に 30 度回転させ、次に y 軸を中心に 60 度回転させることも対称操作になります。一般に、g と h が対称操作である場合、goh も対称操作になります。

対称操作は可逆的でなければなりません。つまり、基になるオブジェクトを変更していない場合は、元の状態に戻れる必要があります (そうでない場合は、情報が失われることになります)。したがって、球体を時計回りに 30 度回転させた場合、反時計回りに 30 度回転させることによって元のアクションを「元に戻す」ことができます。 g が対称である場合、g^-1 が存在する必要があります (また対称でなければなりません)。これにより、gog^-1 = id (同一性) になります。

ドメイン保存アイデンティティ関数 (id) も対称である必要があります。

これらの特性をすべて足し合わせると、すべての対称集合と結合演算子 (o) がグループを形成し、それが本書で広く使用されている数学的構造であることがわかります。

対称性の重要性は、機械学習コミュニティ、特にパターン認識とコンピューター ビジョン アプリケーションにおいて長い間認識されてきました。等価特徴検出に関する初期の研究は、前世紀の天利俊一とライナー レンツの研究にまで遡ることができます。ニューラル ネットワークの分野では、マービン ミンスキー氏とシーモア パパート氏によって提唱されたパーセプトロンの群不変性定理が、(単層) パーセプトロンが不変性を学習する能力の基本的な定義を提供します。これがその後の多層アーキテクチャの研究の出発点となり、最終的にはディープラーニングへとつながりました。

<<:  蔡子星院士:オープンソースは人工知能開発の新たなトレンド

>>:  ロボットがお手伝いします。楽しいメーデーを楽しみましょう!

ブログ    
ブログ    
ブログ    

推薦する

AIが物流業界に革命を起こす5つの方法

人工知能は物流業界に革命を起こす上で重要な役割を果たします。グローバル化により、あらゆるものがデジタ...

AIが作ったノアの箱舟はどこへ行くのでしょうか?

[[348542]]韓国の新人歌手ハヨンが10月8日、人工知能作曲ロボットEvoMがプロデュースし...

...

ファーウェイの天才少年Zhihuiは、かわいいロボットを自作し、5時間でオープンソース化し、GitHubで317個のスターを獲得した。

前回ブドウに縫い目をつけた「完全自社開発」のアイアンマンロボットアーム「ダミー」を覚えていますか? ...

個人情報保護における人工知能データの役割

世界中で人工知能の大規模な構築と応用の発展が加速する中、近年、人工知能ガバナンスの問題が社会の関心を...

...

空から地上へ、そしてついに無人機が海へ

[[251878]]数日前、もう一つの非常に興味深い広告が私の注意を引きました。それはトルコのテクノ...

GNNの実装はもはや難しくありません。この記事では、効率的なGNNとスケーラブルなグラフ表現学習の最新の進歩についてまとめています。

グラフ ニューラル ネットワークは、現実世界に適用する場合、メモリ制限、ハードウェア制限、信頼性制限...

...

これが顔認識と画像認識がますます重要になっている理由です

捜査チームがスケッチアーティストを雇って、目撃者が語った犯人像を描いてもらう犯罪番組を見たことを覚え...

生成 AI 規制: 「ディープフェイク技術」は大規模言語モデルの自由意志を実証するか?

特定のスタイルの生成 AI プロンプトを与えるということは、AI に想像力を働かせてほしいということ...

感情知能の高いNPCがやって来て、手を伸ばすとすぐに次の行動に協力する準備が整いました。

仮想現実、拡張現実、ゲーム、人間とコンピュータの相互作用などの分野では、仮想キャラクターが画面外のプ...

2021年に最も役立つ顔認識ソフトウェア9選をチェック

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

2020年にスパムはなくなるでしょうか?

16 年前、ビル・ゲイツはスパムの問題は 2006 年までに解決すると約束しました。 2020 年...