グラフディープラーニングで複雑な研究​​タイプのタスクを実装するのは、あまりにも面倒ですか?この新しいツールキットは、

グラフディープラーニングで複雑な研究​​タイプのタスクを実装するのは、あまりにも面倒ですか?この新しいツールキットは、

ディープラーニングは、AI分野で最も注目されている分野の1つです。現在、PyGやDGLなどの主流のグラフディープラーニングフレームワークは、主にグラフディープラーニングの基本的な操作とモデルを実装しており、複雑なグラフディープラーニングの研究課題に対処するのは困難です。最近、テキサス A&M 大学の Shuiwang Ji 教授のチームは、グラフ生成、グラフ自己教師学習、グラフニューラルネットワークの解釈可能性、3D グラフディープラーニングタスクなど、複雑な研究​​タスク向けの初のスケーラブルなグラフディープラーニングツールキットを開発しました。このツールキットの目的は、研究者が複雑なグラフディープラーニングタスクのアルゴリズム開発において、共通のデータセットと評価指標を使用して共通のベンチマークと比較しやすくすることです。

グラフ ディープラーニングは、豊富なグラフ構造データからの学習においてその有効性を実証しています。また、新薬の発見、ソーシャル ネットワーク、物理シミュレーションなど、多くの問題において大きな進歩が遂げられています。多くのグラフ ディープラーニング フレームワーク (PyG、DGL など) は、主に基本的なグラフ ディープラーニング モジュールと、ノード分類やグラフ分類などの基本タスクの実装に重点を置いています。しかし、グラフ生成やグラフニューラルネットワークの解釈可能性などの複雑なタスクの場合、研究者はアルゴリズムを実装し、それをベンチマークモデルと比較するために依然として多大な労力を費やす必要があります。

この問題を解決するために、テキサス A&M 大学の Shuiwang Ji 教授が率いる DIVE (データ統合、視覚化、探索) 研究所は、複雑な研究​​タスク向けの初のグラフ ディープラーニング ツールキット DIG (Dive into Graphs) をオープンソース化しました。ツールキットは、研究室の 16 人のチーム (博士課程の学生 14 人、学部生 1 人、指導者 1 人) によって 1 年かけて完成されました。 PyG や DGL などのグラフ ニューラル ネットワーク フレームワークとは異なり、DIG は、現在人気の高い複雑なグラフ ディープラーニング研究タスク向けに、より使いやすく、より高速で、よりスケーラブルなアルゴリズム開発および比較研究プラットフォームを提供することに重点を置いています。

現在、DIG ツールキットは、グラフ生成、グラフ自己教師学習、グラフニューラルネットワークの解釈可能性、3D グラフディープラーニングの 4 つの研究方向をサポートしています。 DIG は、各分野に対して、共通かつ拡張可能なデータ インターフェイス、共通アルゴリズム、評価標準の実装を提供します。

要約すると、DIG は研究者のアルゴリズム開発とベンチマーク モデルとの実験比較を大幅に促進します。

  • 論文アドレス: https://arxiv.org/abs/2103.12608

  • プロジェクトアドレス: https://github.com/divelab/DIG

現在、DIG は 4 つの研究方向で 18 のアルゴリズム、33 のデータセット、7 種類の評価指標をカバーしています。汎用的で拡張可能な実装に基づいて、将来的にはさらに多くの指示とアルゴリズムを DIG に統合できます。ツールキットの全体的な構造を下図に示します。

DIG は 4 つの主要な方向をカバーします。

グラフ生成: グラフ生成アルゴリズムは、指定されたグラフ データ セットに基づいて新しいグラフを生成する方法を研究します。グラフ生成タスクは、医薬品や材料の開発において潜在的に重要な用途を持っています。そのため、DIG では分子グラフを生成できるディープラーニング アルゴリズムを主に検討します。同時に、DIG は、ランダム生成、分子特性の最適化、制約付き分子特性の最適化を評価するための関連指標も実装します。

グラフ上の自己教師学習: 自己教師学習の研究は最近、グラフ データにまで拡張され、特定の自己教師タスクを使用することで、モデルがより効果的なグラフ機能表現を取得できるようになりました。現在、DIG は主に対照学習に基づく共通グラフ自己監督アルゴリズムを実装し、ノード分類とグラフ分類のデータ インターフェースと評価指標を提供しています。

グラフ ニューラル ネットワークの解釈可能性: グラフ ニューラル ネットワークが実際のアプリケーションに導入されるケースが増えるにつれて、モデルをより深く理解するために、グラフ ニューラル ネットワークの解釈可能性に関する研究が重要になってきました。一般的なグラフ ニューラル ネットワーク解釈アルゴリズムが DIG に実装されています。 DIG 開発者は、一般的に使用されるベンチマーク データセットと評価メトリックに加えて、解釈可能性タスク用のテキスト データから人間が理解できるグラフ データセットも構築し、グラフ ニューラル ネットワークの解釈可能性に関するその後の研究を大幅に促進しました。

3D グラフ ディープラーニング: 3D グラフ ネットワークとは、ノードが 3 次元の位置情報を持つグラフ ネットワーク構造を指します。たとえば、分子内の各原子には相対的な 3D 位置があります。グラフ構造における3D位置情報は、グラフネットワークの表現能力を向上させる上で重要な役割を果たすと考えられます。 DIG は、3 つの最新の 3D グラフ ディープラーニング アルゴリズムを 3DGN フレームワークに統合し、統一された実装を提供します。また、一般的な 3D 分子データセット用の統一されたインターフェースと評価メトリックも実装します。

主要な設計ガイドライン

共通実装: DIG には、各研究方向のデータ インターフェイスと評価方法の共通実装があります。これにより、DIG は標準化されたテスト プラットフォームとして機能できるようになります。さらに、ある観点から統一できるアルゴリズムについては、DIG は一般的なアルゴリズム実装も提供します。たとえば、3D グラフのディープラーニング用の 3DGN フレームワークや、グラフの自己教師学習用の比較モデル フレームワークなどです。

スケーラビリティとカスタマイズ性: 共通の実装により、研究者は新しいデータセット、アルゴリズム、評価基準を簡単に統合できます。さらに、ユーザーはデータインターフェースと評価方法を柔軟に選択して実験をカスタマイズできます。したがって、DIG は、研究者が新しいアルゴリズムを実装し、ベンチマーク アルゴリズムとの実験的な比較を実行するためのプラットフォームとして使用できます。

<<:  練習問題をやるのが苦痛すぎる場合はどうすればいいですか?このアルゴリズムベースは初心者向けにカスタマイズされており、アニメーションが付属しています

>>:  Pytorch モデルのトレーニングを最適化するためのヒント

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

キャッシュに関して最も懸念される問題は何ですか?種類は何ですか?リサイクル戦略とアルゴリズム?

[[342437]]著者は、正確なタイミング タスクと遅延キュー処理機能を備えた、高同時実行シナリ...

清華大学と中国気象局の大規模モデルがネイチャー誌に掲載:世界レベルの問題を解決、「幽霊天気」の予報時間が初めて3時間に到達

本当に「雨の日」に備えるために、清華大学の「幽霊天気」予報モデルが登場しました!世界の未解決の問題を...

OpenAIの年間収益は13億ドルに達し、月間1億ドル以上となり、夏に比べて30%増加した。

10月13日、The Informationは現地時間12日、複数の関係者の話として、OpenAI...

...

TensorFlow の最大の機械学習データセット 30 件

導入画像、ビデオ、オーディオ、テキストが含まれており、非常に包括的です。機械学習のための最大のTen...

次のマーク・ザッカーバーグはAIになるのか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

2020 年の最後の 1 か月間に発生した 1,694 件の AI インシデントを包括的にレビューします。ハイライトは何ですか?

今月、ニュースイベント分析、マイニング、検索システム NewsMiner のデータによると、図 1 ...

人工知能は製造業の未来をどのように変えるのでしょうか?

ある研究機関が最近発表した調査報告によると、2022年までに人工知能が製造業にもたらす価値は23億ド...

...

新しい「心を読む」システムにより、音声合成が実際の人間の声に近づく

メディアCNETによると、新しい技術は脳の活動の大部分を合成音声に変換することができ、それによって話...

スマート農業におけるモノのインターネットの応用

人口は飛躍的に増加しており、農業は人口を養う問題を解決する必要がある。農業をより効率的かつ持続可能な...

...

AIが人間の職業を「置き換える」ためのロードマップ

昨日、私はこのような図を見ました。AI がどのように人間に取って代わるかを示すレベル図です。写真写真...

「半導体第一の都市」上海、ついに半導体製造再開の夜明けを迎える

上海市経済情報化委員会は4月16日、「上海市工業企業の業務・生産再開に関する防疫対策ガイドライン(第...

IoT生体認証は職場でより大きな役割を果たす

組織はセンサーや監視を通じて職場のセキュリティと従業員の安全性を向上させるために生体認証を使用できま...