グラフディープラーニングで複雑な研究​​タイプのタスクを実装するのは、あまりにも面倒ですか?この新しいツールキットは、

グラフディープラーニングで複雑な研究​​タイプのタスクを実装するのは、あまりにも面倒ですか?この新しいツールキットは、

ディープラーニングは、AI分野で最も注目されている分野の1つです。現在、PyGやDGLなどの主流のグラフディープラーニングフレームワークは、主にグラフディープラーニングの基本的な操作とモデルを実装しており、複雑なグラフディープラーニングの研究課題に対処するのは困難です。最近、テキサス A&M 大学の Shuiwang Ji 教授のチームは、グラフ生成、グラフ自己教師学習、グラフニューラルネットワークの解釈可能性、3D グラフディープラーニングタスクなど、複雑な研究​​タスク向けの初のスケーラブルなグラフディープラーニングツールキットを開発しました。このツールキットの目的は、研究者が複雑なグラフディープラーニングタスクのアルゴリズム開発において、共通のデータセットと評価指標を使用して共通のベンチマークと比較しやすくすることです。

グラフ ディープラーニングは、豊富なグラフ構造データからの学習においてその有効性を実証しています。また、新薬の発見、ソーシャル ネットワーク、物理シミュレーションなど、多くの問題において大きな進歩が遂げられています。多くのグラフ ディープラーニング フレームワーク (PyG、DGL など) は、主に基本的なグラフ ディープラーニング モジュールと、ノード分類やグラフ分類などの基本タスクの実装に重点を置いています。しかし、グラフ生成やグラフニューラルネットワークの解釈可能性などの複雑なタスクの場合、研究者はアルゴリズムを実装し、それをベンチマークモデルと比較するために依然として多大な労力を費やす必要があります。

この問題を解決するために、テキサス A&M 大学の Shuiwang Ji 教授が率いる DIVE (データ統合、視覚化、探索) 研究所は、複雑な研究​​タスク向けの初のグラフ ディープラーニング ツールキット DIG (Dive into Graphs) をオープンソース化しました。ツールキットは、研究室の 16 人のチーム (博士課程の学生 14 人、学部生 1 人、指導者 1 人) によって 1 年かけて完成されました。 PyG や DGL などのグラフ ニューラル ネットワーク フレームワークとは異なり、DIG は、現在人気の高い複雑なグラフ ディープラーニング研究タスク向けに、より使いやすく、より高速で、よりスケーラブルなアルゴリズム開発および比較研究プラットフォームを提供することに重点を置いています。

現在、DIG ツールキットは、グラフ生成、グラフ自己教師学習、グラフニューラルネットワークの解釈可能性、3D グラフディープラーニングの 4 つの研究方向をサポートしています。 DIG は、各分野に対して、共通かつ拡張可能なデータ インターフェイス、共通アルゴリズム、評価標準の実装を提供します。

要約すると、DIG は研究者のアルゴリズム開発とベンチマーク モデルとの実験比較を大幅に促進します。

  • 論文アドレス: https://arxiv.org/abs/2103.12608

  • プロジェクトアドレス: https://github.com/divelab/DIG

現在、DIG は 4 つの研究方向で 18 のアルゴリズム、33 のデータセット、7 種類の評価指標をカバーしています。汎用的で拡張可能な実装に基づいて、将来的にはさらに多くの指示とアルゴリズムを DIG に統合できます。ツールキットの全体的な構造を下図に示します。

DIG は 4 つの主要な方向をカバーします。

グラフ生成: グラフ生成アルゴリズムは、指定されたグラフ データ セットに基づいて新しいグラフを生成する方法を研究します。グラフ生成タスクは、医薬品や材料の開発において潜在的に重要な用途を持っています。そのため、DIG では分子グラフを生成できるディープラーニング アルゴリズムを主に検討します。同時に、DIG は、ランダム生成、分子特性の最適化、制約付き分子特性の最適化を評価するための関連指標も実装します。

グラフ上の自己教師学習: 自己教師学習の研究は最近、グラフ データにまで拡張され、特定の自己教師タスクを使用することで、モデルがより効果的なグラフ機能表現を取得できるようになりました。現在、DIG は主に対照学習に基づく共通グラフ自己監督アルゴリズムを実装し、ノード分類とグラフ分類のデータ インターフェースと評価指標を提供しています。

グラフ ニューラル ネットワークの解釈可能性: グラフ ニューラル ネットワークが実際のアプリケーションに導入されるケースが増えるにつれて、モデルをより深く理解するために、グラフ ニューラル ネットワークの解釈可能性に関する研究が重要になってきました。一般的なグラフ ニューラル ネットワーク解釈アルゴリズムが DIG に実装されています。 DIG 開発者は、一般的に使用されるベンチマーク データセットと評価メトリックに加えて、解釈可能性タスク用のテキスト データから人間が理解できるグラフ データセットも構築し、グラフ ニューラル ネットワークの解釈可能性に関するその後の研究を大幅に促進しました。

3D グラフ ディープラーニング: 3D グラフ ネットワークとは、ノードが 3 次元の位置情報を持つグラフ ネットワーク構造を指します。たとえば、分子内の各原子には相対的な 3D 位置があります。グラフ構造における3D位置情報は、グラフネットワークの表現能力を向上させる上で重要な役割を果たすと考えられます。 DIG は、3 つの最新の 3D グラフ ディープラーニング アルゴリズムを 3DGN フレームワークに統合し、統一された実装を提供します。また、一般的な 3D 分子データセット用の統一されたインターフェースと評価メトリックも実装します。

主要な設計ガイドライン

共通実装: DIG には、各研究方向のデータ インターフェイスと評価方法の共通実装があります。これにより、DIG は標準化されたテスト プラットフォームとして機能できるようになります。さらに、ある観点から統一できるアルゴリズムについては、DIG は一般的なアルゴリズム実装も提供します。たとえば、3D グラフのディープラーニング用の 3DGN フレームワークや、グラフの自己教師学習用の比較モデル フレームワークなどです。

スケーラビリティとカスタマイズ性: 共通の実装により、研究者は新しいデータセット、アルゴリズム、評価基準を簡単に統合できます。さらに、ユーザーはデータインターフェースと評価方法を柔軟に選択して実験をカスタマイズできます。したがって、DIG は、研究者が新しいアルゴリズムを実装し、ベンチマーク アルゴリズムとの実験的な比較を実行するためのプラットフォームとして使用できます。

<<:  練習問題をやるのが苦痛すぎる場合はどうすればいいですか?このアルゴリズムベースは初心者向けにカスタマイズされており、アニメーションが付属しています

>>:  Pytorch モデルのトレーニングを最適化するためのヒント

ブログ    
ブログ    

推薦する

...

Alibaba iDSTのビジュアルコンピューティング責任者、Hua Xiansheng氏:アルゴリズムの利点は消えつつある

「テクノロジー研究と現実世界の問題を組み合わせ、現実の問題を解決して価値を生み出すことにますます興味...

人工知能の新時代が近づいています。従来の産業の従事者はどこへ向かうのでしょうか?

世間の好むと好まざるとにかかわらず、人工知能の新しい時代が静かに到来した。しかし、人工知能が本格的に...

Llama 2 の精度を 80.3% まで高めるヒントは何でしょうか? Metaは、モデルの幻覚を大幅に削減する新しい注意メカニズムS2Aを提案している。

2023年の科学技術の世界は、(偽の室温超伝導を除いて)大型モデルが主流であると言えます。私たちは...

10年前、古典的なword2vec論文が今日のNeurIPSタイムテスト賞を受賞しました

NeurIPS は世界で最も権威のある AI 学術会議の 1 つです。正式名称は Neural In...

データ構造とアルゴリズム: 同型文字列

[[441407]]同型文字列LeetCode の質問へのリンク: https://leetcode...

Facebook が ICCV 2021 で 2 つの 3D モデルを公開。自己監督が究極の答えか?

長い間、CV トレーニングは 2 次元データに限定されてきました。3 次元データのラベル付けにはコス...

比較ベースのアルゴリズムでは、5 つの要素をソートするのに 7 回のパスが必要だと言われるのはなぜですか?

結果のソートアルゴリズムの唯一の要件は、オペランドが全順序関係を満たすことです。 a≤b かつ b≤...

...

スマートデバイスとエッジコンピューティングはどのように発展するのでしょうか?

エッジコンピューティングが増加しています。 AI とネットワークの進歩を組み合わせて、より強力なロー...

アップルの自動運転テストカーは8月に2回の軽微な衝突事故を起こしたが、どちらも事故の原因ではなかった

海外メディアAppleInsiderによると、今年8月、アップルの自動運転車群の2台がカリフォルニア...

機械学習の決定木とランダムフォレストモデル

[[206785]]決定木導入決定木は機械学習において非常に一般的な分類方法です。すべてのアルゴリズ...

人工知能でIT運用を改革する方法

IT 組織は、サポートの改善、インフラストラクチャの最適化、システム障害の予測のために AI ベース...

ニュースローン賞受賞者 宋 樹蘭: 視覚の観点からロボットの「目」を構築する

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...