ベイジアンディープラーニング: ディープラーニングと確率的グラフィカルモデルを統合するフレームワーク

人工知能 (AI) の進歩により、多層のディープネットワークを構築し、大量のデータを学習に活用することで、大幅なパフォーマンスの向上が達成できることが示されました。しかし、これらの進歩は主に知覚タスクで起こったものであり、認知タスクでは従来の AI パラダイムを拡張する必要があります。

4月9日、ラトガース大学コンピューターサイエンス科助教授の王昊氏は、AI TIME Young Scientists - AI 2000 Scholars Forumで、ディープラーニングと確率的グラフィカルモデルを統合し、AIの認識と推論のタスクを統合できるベイズに基づく確率的フレームワークを共有した。

報告によると、このフレームワークには、確率的ディープモデルによって表されるディープモジュールと、確率的グラフモデルであるグラフモジュールの 2 つのモジュールがあります。ディープモジュールは高次元信号を処理し、グラフモジュールは部分的な推論タスクを処理します。

以下はスピーチの全文です。AI Technology Review では、原文の意味を変えずに編集しています。

今日は、ベイジアンディープラーニングに関する私の研究についてお話ししたいと思います。トピックは、私たちが研究してきた確率的フレームワークです。私たちは、これを使用してディープラーニングと確率的グラフィカルモデルを統合し、AI の認識と推論のタスクを統合したいと考えています。

ご存知のとおり、ディープラーニングを活用した AI テクノロジーには、物体を認識できる視覚機能、テキストを理解できる読解機能、音声を認識できる聴覚機能がすでに備わっています。しかし、私にはまだ思考力が欠けています。

「思考」は推論や推測のタスクに対応し、具体的には条件付き確率関係や因果関係などの複雑な関係を処理できます。

ディープラーニングは知覚タスクの処理に適していますが、「思考」には意思決定のためのデータ分析や論理的推論などの高度な知能が関わってきます。確率グラフは、変数間の複雑な関係を自然に表現できるため、推論タスクの処理に利点があります。

上図は概要図の例です。課題は、スプリンクラーヘッドのオン/オフと外の天気から、外の芝生が濡れている可能性を推測するか、芝生の濡れ具合から天気を推測することです。確率グラフの欠点は、高次元データを効率的に処理できないことです。

まとめると、ディープラーニングは知覚タスクには優れていますが、推論や推測タスクには優れていません。確率的グラフィカルモデルは推論タスクには優れていますが、知覚タスクには優れていません。

残念ながら、現実の世界では、これら 2 種類のタスクは通常同時に発生し、相互に影響を及ぼします。したがって、私たちは、ディープラーニングの確率グラフを単一のフレームワークに統合し、両方の長所を活かすことを期待しています。

私たちが提案するフレームワークはベイズ深層学習です。モジュールは 2 つあります。確率的ディープモデルによって表されるディープモジュールと、確率的グラフモデルであるグラフモジュールです。ディープモジュールは高次元信号を処理し、グラフモジュールは部分的な推論タスクを処理します。

グラフモジュールは本質的に確率モデルであるため、融合を確実に行うには、ディープモデルも確率的である必要があることに注意してください。モデルは、MAP、MCMC、VI などの従来のアルゴリズムを使用してトレーニングできます。

具体的な例を挙げると、医療診断の分野では、ディープモジュールは医師が患者の医療画像を見ることを、イメージモジュールは医師が画像に基づいて脳内で病気について判断し推論することをイメージできます。医師の視点から見ると、医用画像における生理学的信号は推論の基礎であり、優れた能力は医用画像に対する理解を深めることができます。

さらに、映画推奨システムでは、ディープモジュールは映画のビデオプロット、俳優、その他のコンテンツを理解するものと考えられ、グラフモジュールはユーザーの好みと映画の好みの類似性をモデル化する必要があります。さらに、ビデオコンテンツの理解と「好み」のモデリングも補完的です。

モデルの詳細に関しては、確率グラフィカルモデルの変数を 3 つのカテゴリに分類します。ディープ変数はディープモジュールに属し、比較的単純な確率分布から生成されると想定されます。グラフ変数はグラフモジュールに属し、ディープモジュールに直接接続されておらず、比較的複雑な分布から生成されると想定されます。ハブ変数は、ディープモジュールとグラフモジュール間の相互接続部分です。

以下では、実際のアプリケーションでフレームワークがどのように機能するかについて説明します。

その他のアプリケーション設計

グラフが与えられれば、エッジがわかり、ノードの内容が理解できます。この画像がソーシャルネットワークである場合、それは実際にはユーザー間の友情を表し、ノードコンテンツはソーシャルプラットフォーム上でユーザーが投稿した画像またはテキストです。この種のグラフ関係は、論文のタイトル、要約、引用などの間のつながりを表すこともできます。

私たちの仕事は、モデルがノードの表現を学習できるようにすること、つまりコンテンツ情報とグラフ情報の両方をキャプチャできるようにすることです。

解決策は、ベイジアン深層学習フレームワークに基づいてリレーショナル確率オートエンコーダを設計することです。ディープモジュールは、各ノードのコンテンツの処理を特に担当します。結局のところ、ディープラーニングは高次元情報の処理に利点があり、グラフモジュールは引用ネットワークやナレッジグラフ内の複雑な関係など、ノード間の関係を処理します。

医療分野では、医療モニタリングに注力しています。タスクのシナリオは、自宅に信号を発する小型レーダーがあるというものです。設計されたモデルは、患者から反射された信号に基づいて、患者が時間通りに正しい順序で薬を服用しているかどうかを検出できることを期待しています。問題は、薬を服用する手順が非常に複雑で、順序を整理する必要があることです。

ベイジアン深層学習確率フレームワーク法に基づいて、深層モジュールを使用して非常に高次元の信号情報を処理し、グラフモジュールを使用して医療独自の知識をモデル化します。

異なるアプリケーションの同じモデルであっても、その中のパラメータには異なる学習方法があることに留意してください。たとえば、MAP 法とベイズ法を使用して、パラメータ分布を直接学習できます。

ディープニューラルネットワークの場合、パラメータ分布がわかれば、予測の不確実性を推定するなど、さまざまなことが可能になります。さらに、パラメータ分布が得られれば、データが不十分な場合でも非常に堅牢な予測が得られます。同時に、モデルはより強力になります。結局のところ、ベイズモデルは無数のモデルをサンプリングすることと同等です。

以下は、あらゆるディープラーニングモデルまたはディープニューラルネットワークで使用できる軽量のベイズ学習方法です。

まず、モデルが直感的でありながら、バックプロパゲーションを通じて学習し、サンプリングプロセスを「破棄」できるほど効率的な方法を実現することが目標です。

私たちの重要なアイデアは、ニューラルネットワークのニューロンとパラメータを、高次元空間内の単なる点やベクトルとしてではなく、分布として捉えることです。学習プロセス中にニューラルネットワークが順方向伝播と逆方向伝播を実行できるようにします。分布が自然なパラメータによって表現されるため、この方法は NPN (自然パラメータネットワーク) と呼ばれます。

<<: 自律飛行ロボットが浙江大学から集団で飛び立ち、サイエンス誌の表紙に登場

>>: 初めてバーチャルヒューマンに関する業界の合意が成立