機械学習の未来はここにある:ガウス過程とニューラルネットワークは同等である

機械学習の未来はここにある:ガウス過程とニューラルネットワークは同等である

ガウス過程は以前から存在していましたが、それに対する関心が大きく再燃したのはここ 5 ~ 10 年ほどのことです。これは、ソリューションの計算の複雑さに一部起因しています。モデルでは行列の逆変換が必要なため、複雑さは O(n3) となり、高速化が困難です。このため、コンピューティング能力が非常に弱かったため、しばらくの間、解決が困難でしたが、過去数年間、ML を背景にした多大な研究と資金提供により、解決が大幅に可能になりました。

ガウス過程の最も優れた特徴の 1 つは、ニューラル ネットワークと非常によく似ていることです。実際、ガウス過程 (GP) は、そのパラメータが自身のパラメータよりも iid が高い単層完全接続ニューラル ネットワークと同等であることはよく知られています。

これについては明確にしておきたいのですが、以下に挙げる証拠は単純ですが、広範囲にわたる影響を及ぼします。中心極限定理は、一見複雑な現象を統一することができます。その場合、最もパフォーマンスの高いモデルは、その分野がまだ完全に成熟していない機械学習モデルのサブセットと見なすことができます。

はい、GP は常に研究されてきましたが、DNN を構成する非線形パターン (ジャンプなど) を特徴付けることができる深層ガウス過程 (特に、XOR ロジックをモデル化できる) が研究者によって開発されたのはここ数年のことです。したがって、この点から、非常に多くの利益があることがわかります。

私はこの証拠を調べたいと思っていましたが、それはかなり単純です。以下の記事は、Li 氏らによる Google Brain 新聞から引用したものです。この記事を非常に便利に作成していただいた Li 氏らに感謝いたします。

小さなシンボル

注意: 「media」のすべてに下付き文字を付けることはできません。そのため、アンダースコア (M_l) が表示されている場合は、下付き文字として l が付いた M を意味していると想定してください。つまり、Mi + m

隠し幅 N_l (層 L の場合) を使用して L 層を持つ完全に接続されたニューラル ネットワークを考えます。 x∈Rdɪをネットワークへの入力とし、zlをその出力(層L)とする。 l 番目の層の i 番目の活性化コンポーネントは、xli および zli として表されます。 l 番目の層の重みとバイアス パラメータの iid 値はゼロであり、バイアス パラメータは平均がゼロで σ 2_w/N_l であると想定されます。

[[351436]]
> Unsplash の Maximalfocus による写真

ニューラルネットワーク

これで、ニューラル ネットワーク出力の i 番目のコンポーネント (zli) は次のように計算されることがわかりました。

入力 x への依存性を示します。重みとバイアスパラメータは iid であると想定されるため、xli と xli' の pos 活性化関数は j=/j' に対して独立です。

ここで、zli(x) は iid 項の合計であるため、中心極限定理に従います。したがって、無限幅 (N1->∞) の極限では、zli(x) もガウス分布になります。

ガウス過程

同様に、多次元 CLT から、任意の有限変数セット z は共同多変量ガウス分布になることが推測できます。これは、ガウス過程の正確な定義です。

したがって、zli(x)=GP(μ1,K1)は平均μ1と共分散K1を持つガウス過程であり、それ自体はiとは独立していると結論付けることができます。パラメータの平均はゼロなので、μ1=0ですが、K1(x, x')は次のようになります。

ここで、この共分散は、W0 と b0 の分布を積分することによって得られます。 i=/=j である任意の 2 つの zli と zlj は共分散がゼロの共ガウス分布であるため、隠れ層によって生成された同じ関数を使用しているにもかかわらず、独立していることが保証されることに注意してください。

[[351439]]
> 写真提供:バーミンガム博物館トラスト(Unsplash)

いくつかの証明は単純かつ論理的であり、中心極限定理の魔法は、すべてをガウス分布の下で統一することです。ガウス分布は、変数 (または次元) の周辺化と条件付けによってガウス分布が得られ、関数形式がかなり単純であるため、閉じた形式のソリューションに凝縮できるため (そのため、最適化手法はほとんど必要ありません)、優れています。

私の論理をどう思うか教えてください。疑問があれば質問してください。また、何か見落としている点があれば教えてください。

私の最新の記事を常にチェックしてください!

<<:  指紋、顔、虹彩: 適切な生体認証技術を選択するには?

>>:  人工知能が人間に危害を加えた場合、誰が責任を負わされるのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

銀行は人工知能を導入し、スマートな顧客サービス以上のものを提供している

[[433578]]最近、ある有名なメディア関係者が銀行からカスタマーサービスに電話を受け、しばらく...

アルゴリズムに関する漫画: コンシステント・ハッシュとは何ですか?

1年前——同システムでは、今後2年間で総注文数が約1億件に達すると予測している。 1 つの MyS...

...

CVPR 自動運転チャレンジで優勝したのはどのようなソリューションでしょうか?

道路は複雑で、車両の種類も多様で、歩行者も密集しています。これが都市部の道路交通の現状であり、自動運...

...

GAN が「思考を偽装」してネイチャー誌に登場: 初の合成神経活動データ

[[436236]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

AIoT: IoTと人工知能の完璧な組み合わせ

産業用 IoT は、企業の神経系と考えることができます。つまり、生産工場のあらゆる場所から貴重な情報...

ロボットのウォーリーがやってきた!ディズニーは、RLを使って歩くことを学び、社会的にも交流できる新しいロボットを発表した。

チン、チン、チン、『ウォーリー』が舞台に登場!頭は平らで、体は四角い。地面を指差して見るように言うと...

調査レポート:2021年の人工知能開発動向予測

人工知能は、幅広い議論を巻き起こすだけでなく、人々に未来への無限の夢を抱かせるようなさまざまなテクノ...

Huaweiの「ブラックテクノロジー」がついに公開。サイバーバース以外にも重要なニュースがある

8月11日はHuawei Developer Conferenceの3日目であり、カンファレンスの議...

...

マシンビジョンにはどのようなハードウェアが含まれていますか?

画像およびマシンビジョン技術を使用した産業オートメーションとインテリジェンスの需要があらゆる分野で広...

デジタルトランスフォーメーションにおけるAIビッグモデルの現状と役割を客観的に見る

「デジタル変革における AI ビッグモデルの役割は、『データ中心のビジネス変革の 3 つのパラダイム...