第4回パラダイム NeurIPS 2020: ナレッジグラフ埋め込みの自動化

第4回パラダイム NeurIPS 2020: ナレッジグラフ埋め込みの自動化

少し前に、Fourth Paradigm の上級研究員である Quanming Yao 博士が、NeurIPS 2020 に参加して採択された論文「Interstellar: ナレッジ グラフ埋め込みのためのリカレント アーキテクチャの検索」を皆さんと共有しました。

[[354582]]

この研究では、Neural Architecture Search (NAS) にヒントを得て、リレーショナル パスで情報を処理するための再帰アーキテクチャとして Interstellar を提案します。さらに、本研究における新しいハイブリッド検索アルゴリズムは、スタンドアロンおよびワンショット検索方法の限界を打ち破り、複雑な検索空間を持つ他の分野にも適用できる可能性があります。

ビデオリンク: https://v.qq.com/x/page/n3207ugke4j.html?start=6

ナレッジ グラフ エンベディングは現在、ナレッジ グラフ (KG) 内の知識表現を学習する強力な機能を備えています。これまでの研究では、多くの研究が主に単一のトリプレットのモデリングに焦点を当てていました。しかし、KG の場合、トリプレット間の長いチェーンの依存関係情報もいくつかのタスクでは重要です。

NeurIPS 2020カンファレンスで採択されたFourth Paradigmと香港科技大学のこの論文では、研究者らがトリプレットで構成された関係パスに基づくInterstellarモデルを提案し、再帰ニューラルネットワークを検索することで関係パス内の短鎖および長鎖情報を処理しました。

論文リンク: https://arxiv.org/pdf/1911.07132.pdf

コードリンク: https://github.com/AutoML-4Paradigm/Interstellar

まず、本研究では、一連のシミュレーション実験を通じて、異なるタスクの関係パスを単一のモデルでモデル化することの難しさについて分析し、検索を通じて異なるタスクを対象とするモデル化を提案した。検索効率を向上させるために、本研究では、リンク予測とエンティティアライメントタスクでより効果的なモデルを効率的に検索できるハイブリッド検索アルゴリズムを提案しました。

背景

ナレッジ グラフ埋め込み (KG 埋め込み) は、グラフの重要なプロパティを保持しながら、グラフ内のエンティティと関係を低次元空間にマッピングすることを目的としています。現在の学術分野では、TransE、RESCAL、DistMult、RotatE、ConvE、SimplE など、いくつかの研究は単一の 3 つの (s、r、o) モデリングに基づいています。これらは、リンク予測タスク (つまり、ヘッド ノード s とリレーション r が与えられた場合、テール ノード o を予測する) では優れたパフォーマンスを発揮しますが、ノード マッチング タスク (つまり、2 つの KG が与えられた場合、どのノードが同じ意味を持つかを予測する) でも一般的に優れたパフォーマンスを発揮します。 IPTransE、Chains、RSN などのリレーショナル パスに基づく別のタイプの作業は、ノード マッチング タスクでより優れたパフォーマンスを発揮します。

研究者は、関係パスには、単一のトリプルの短いチェーン情報、複数の関係の組み合わせ、複数のトリプル間の長いチェーン情報など、さまざまな重要な情報が含まれていることを観察しました。これを踏まえて、本研究では、検索手法を用いてさまざまなタスクに応じて関係パスをターゲットにモデル化する Interstellar モデルを提案しました。

モチベーション

異なるモデルがさまざまなタスクに対して異なる適合能力を持っていることを確認するために、研究者は一連のシミュレーション実験を設計しました。 Countries データセットには、S1 ~ S3 の 3 つの異なるタスクがあります。予測の難易度は 1 つずつ増加し、シミュレートする必要がある予測パスは徐々に長くなります。この目的のために、研究者らは事前の知識に基づいて 4 種類のパターン P1 ~ P4 を設計しました。これらのパターンは、単一のトリプル、連続する 2 つのトリプル、複数の関係の複合、および完全に再帰的な接続をモデル化するために使用されます。直感的に、P4 はより強力なモデリング機能を備えていますが、サンプルが限られている場合は、サンプルの複雑さも同様に重要です。データ パターンにより適合するモデルを選択すると、より良い結果が得られます。

下の表に示すように、単純なタスク S1 では、1 つまたは 2 つのトリプレットに基づくモデル P1 と P2 のパフォーマンスが優れており、S2 では P1 ~ P3 はすべて P4 よりも優れており、S3 ではより長いパスをシミュレートできるため再帰モデル P4 が勝っています。このことから、リレーショナル パスのモデリングはモデルに依存する必要があるという結論が導き出されます。検索を通じて専門家の事前知識をモデリング機能に組み込むことができれば、モデルはさまざまなタスクに対してより優れたソリューションを自動的に見つけることができます。

問題の定義と探索空間

まず、研究者らは Interstellar を、関係パスを再帰的に処理するモデルとして定義しました。各再帰ステップで、モデルはトリプルに焦点を当て、トリプル内およびトリプル間でさまざまな方法で情報が移動します。従来の RNN とは異なり、ここでの各ステップには 2 つの入力があります。同時に、ナレッジ グラフに関連するドメイン知識を考慮する必要があるため、単に RNN を使用してモデル化するのは適切ではありません。本研究では、知識グラフの分野における事前知識を有効に活用し、モデルをさまざまなタスクに適用できるようにするために、ニューラルアーキテクチャ検索技術(Neural Architecture Search)に着想を得て、さまざまなタスクを適応的にモデル化する検索問題としてモデリング問題を定義します。

本研究では、知識グラフ埋め込みの分野における関連モデルをまとめ、上図の検索空間を提案し、演算ユニットO_sを使用してノード埋め込みs_tを処理し、O_rを使用して関係埋め込みr_tを処理し、O_vを使用してベクトルv_tを出力し、次のノードs_t+1を予測します。具体的には、マクロレベルでは異なるユニット間の接続とコンビネーターを検索し、ミクロレベルでは活性化関数と重み行列を検索します。

検索アルゴリズム

この研究の目的は、2 レベル最適化アプローチによって定義できる検索空間で、検証セットに対してより迅速に優れたパフォーマンスを達成するモデルを見つけることです。この最適化問題を解決するために、現在、学界では 2 種類の方法が存在します。 1 つはスタンドアロン アルゴリズムで、各モデルのパラメータ F を収束するまで個別にトレーニングするため、正確なパフォーマンス評価 M が得られますが、トレーニング コストが高くなります。もう 1 つはワンショット アルゴリズムで、すべてのネットワークを含むスーパーネットを構築します。スーパーネットでは異なるモデルがサンプリングされ、パラメータを共有できます。この評価方法はより効率的ですが、信頼性が常に保証されるわけではありません。研究者たちは、ワンショットアプローチはインターステラーのモデリングにおいては信頼できないと観察した。

これらの問題を解決するために、本研究ではハイブリッド検索アルゴリズムを提案しました。マクロレベルでは、スタンドアロンアプローチが使用されます。α_2が与えられた場合、Α_1から異なるα_1がサンプリングされ、モデルパラメータは収束するまでトレーニングされ、α_1の信頼性の高い評価が得られます。ミクロレベルでは、ワンショットアプローチが使用されます。α_1が与えられた場合、Α_2から異なるα_2がサンプリングされます。同時に、異なるα_2に対応するモデルはハイパーネットワーク内でパラメータを共有し、トレーニングと評価のプロセスを加速します。これら 2 つを組み合わせることで、検索の精度と検索の効率の両方が保証されます。

実験結果

検索結果に関して言えば、この方法は、Interstellar の合理的な検索空間と効率的な検索アルゴリズムのおかげで、ノード マッチング タスクとリンク予測タスクの両方で、さまざまなデータ タスクに対してより優れたモデルを検索できます。

検索効率の点では、ハイブリッド アルゴリズムは、ランダム、強化、ベイズ最適化アルゴリズムよりも速く、より優れたモデルを取得できます。同時に、下の図の 2 つの点線 (単一のワンショット アルゴリズムを表す) は、この問題に対するパフォーマンスが良くないことを示しています。検索時間に関して言えば、ハイブリッド アルゴリズムとパラメータ調整 (学習率、バッチ サイズなど) にかかる時間は同程度であり、この検索方法は高価ではないことがわかります。新しい問題では、まずモデルを検索してからパラメータを調整することをお勧めします。

<<:  GoogleとDeepMindは、6つのタスクと複数のデータタイプに対する効率的なTransformer評価ベンチマークを提案

>>:  このAIはガールフレンドの自撮りを手伝います: 写真から3D動画を生成

ブログ    
ブログ    
ブログ    

推薦する

スマートカーのブラックテクノロジーとは何ですか?

AlphaGoとイ・セドルの人間対機械の戦い以来、人工知能はかつてないほどの注目を集め、大手企業が...

ボストン住宅データセットに基づくシンプルなMLP回帰モデルのトレーニング

[[422501]]多層パーセプトロン(MLP)は非常に長い歴史を持っています。多層パーセプトロン(...

...

人工知能と5Gアプリケーションはもはや単なる「紙の設計図」ではなく、デジタル経済の発展が加速している

新たな科学技術革命と産業変革が加速する中、デジタル技術がもたらす成長の配当をすべての人がいかに共有で...

ロボティックプロセスオートメーションが人々の働き方をどのように変えているのか

[[422319]] RPA は人々の働き方をどのように変えるのでしょうか?今日、さまざまな業界の組...

ガートナーレポート: 私たちはデータサイエンスと機械学習ツールの「大爆発」の時代を迎えている

ガートナー社によると、現在データサイエンスに使用されているツールは急速に変化しているという。同社は新...

AIは役に立たないなんて誰が言ったのでしょうか?パンデミックの間、AIは人類のために多くのことを行ってきました...

[[314062]] 10日以上も経過したが、流行は収束の兆しを見せず、事態はますます深刻化してい...

専門家の視点:汎用人工知能の可能性

人工知能分野の発展に関するニュースを追う際の課題の 1 つは、「AI」という用語が、無関係な 2 つ...

MetaはGPT-3を模倣し、OpenAIを「裏切り」、完全なモデルの重みとトレーニングコードが完全に公開される

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ロボットの認識システムはどのように機能するのでしょうか?

ビジュアルサーボシステムは、視覚情報をフィードバック信号として使用し、ロボットの位置と姿勢を制御およ...

情報の流れの中のゲーム:「易典子心」の探求と思考

[51CTO.comより引用] 「易典子訓」アプリを開くと、オープニング画面に「良質なコンテンツ、価...

OpenAIの取締役会が数秒で後悔!ウルトラマン、CEOに復帰要請

たった1日で、OpenAIの取締役会は劇的に変化しました。最新のニュースによると、ウルトラマンがCE...

安全性は小さな問題ではありません。これがAI時代に彼らが選択することです

AI時代においては、セキュリティを早急に再定義する必要があります。人工知能やモノのインターネットなど...

リアルタイム、高精細、高忠実度:より強力なビデオ再構成アルゴリズム、大幅に向上したパフォーマンス

画像編集の分野がここ数年で飛躍的に成長したことは周知の事実です。しかし、ビデオ分野ではまだいくつかの...

Pythonとdlibを使用した顔検出

「Dlib は、高度なソフトウェアを作成するための機械学習アルゴリズムとツールの最新の C++ ツー...