量子畳み込みネットワークにおける「不毛のプラトー」現象が解決され、新たな研究により量子AIの大きな問題が克服された

量子畳み込みネットワークにおける「不毛のプラトー」現象が解決され、新たな研究により量子AIの大きな問題が克服された

量子コンピュータの出現は、コンピュータ分野に多くの進歩をもたらしました。量子コンピュータ上で実行される畳み込みニューラル ネットワークも、従来のコンピュータよりも量子データをより適切に分析できる可能性を秘めていることから、大きな注目を集めています。量子ニューラル ネットワーク (QNN) は、物理シミュレーション、最適化などの用途を持つ、最も有望なアーキテクチャの 1 つと考えられています。

QNN の大きな可能性にもかかわらず、多くの QNN アーキテクチャは「不毛のプラトー」現象に悩まされていることが示されています。この現象では、コスト関数の勾配がシステムのサイズとともに指数関数的に消失し、QNN アーキテクチャが大規模な問題に対してトレーニングできなくなります。

最近、ロスアラモス国立研究所 (LANL) とユニバーシティ・カレッジ・ロンドンの研究者らは、不毛なプラトーを持たない特定の QNN アーキテクチャを構築しました。研究論文「量子畳み込みニューラルネットワークにおける不毛なプラトーの不在」が PHYSICAL REVIEW X に掲載されました。

論文アドレス: https://journals.aps.org/prx/pdf/10.1103/PhysRevX.11.041011

ロスアラモス国立研究所 (LANL) とユニバーシティ・カレッジ・ロンドンによるこの研究では、最近提案された量子畳み込みニューラルネットワーク (QCNN) アーキテクチャにおけるパラメータの勾配スケーリングを厳密に分析します。研究では、勾配の分散が多項式よりも速く消失しないことが分かりました。これは、QCNN が不毛なプラトー現象を経験しなかったことを意味します。この結果は、ランダム初期化による QCNN のトレーニング可能性に対する解析的保証を提供し、QCNN がランダム初期化でトレーニング可能であるという点で他の多くの QNN アーキテクチャとは異なることを強調しています。

勾配消失問題を回避する

その解析結果を得るために、本研究では、ハール分布ユニタリーの期待値を解析する新しいグラフベースの方法を提案しました。これは非常に効果的な方法である可能性があります。最後に、この研究では数値シミュレーションを使用して分析結果を検証しました。

QCNN アーキテクチャ

QCNN アーキテクチャには、データの特性に関する情報を保持しながら量子ビットの数を削減する一連の畳み込み層とプーリング層が含まれます。

下の図 1 に示すように、QCNN アーキテクチャは、ヒルベルト空間 H_in 内の n 量子ビットの入力状態 ρ_in を入力として受け取り、一連の畳み込み層とプーリング層で構成される回路に送ります。畳み込み層は、隣接する量子ビットの交互のペアに作用する、パラメーター化された 2 量子ビット ゲートの 2 列で構成されます。各プーリング層では、量子ビットの半分が測定され、これらの測定結果によって隣接する量子ビットに適用されるユニタリが制御されます。 QCNN には、L 畳み込み層とプーリング層の後に、残りの量子ビットにユニタリを適用する完全接続層も含まれます。最後に、あるエルミート演算子 O の期待値を測定します。

QCNN アーキテクチャ図

この研究では、QCNN の入力状態をヒルベルト空間の縮小状態にマッピングします。ここで、H_out の次元は H_in の次元よりもはるかに小さくなります。出力ステータスは次のように表現されます。

ここで、V(θ) は畳み込み層とプーリング層、および完全接続層のゲートを含むユニタリであり、θ は H_out を除くすべての量子ビットの部分トレースを表すトレーニング可能なパラメータのベクトルです。 QCNN の非線形性はプーリング層内のプーリング演算子に起因し、各層の自由度を実質的に低下させることに注意してください。

コスト関数

QCNNの目標は、入力状態を含むトレーニングセットS(サイズM = |S|)を適用して、QCNNのパラメータを最適化し、コスト関数を最小化することです。これは次のように表すことができます。

ここでc_αは下式(1)から得られる実係数であり、各入力状態はρ_inである。

仮説

簡潔にするために、この研究では主に n=2^k および L=log(n)=k の 2 つのケースを検討します。したがって、dim(H_out)=2 となります。さらに、この研究では、畳み込み層とプーリング層のユニタリが独立していると仮定しています。つまり、V(θ)の畳み込み層と完全結合層は、隣接する量子ビットに作用する2つの量子ビットパラメータ化されたユニタリブロックで構成され、 と表記されます。

研究者らは、この一般化には、同じ畳み込み層またはプーリング層内のブロックが同一である特殊なケースとして、一般的な QCNN 構造が含まれていると指摘しています。さらに、研究者らは論文の結果のセクションで、畳み込み層におけるユニタリー相関がコスト関数の勾配振幅を増加させる傾向があることを論じました。

式(13)に示すように、コスト関数の偏微分の分散はI_ijの制御されたユニタリに依存しないため、プーリング層における演算子I_ijの効果は畳み込み層におけるユニタリの効果に結びつくことができる。したがって、QCNN のテンソル ネットワーク表現を以下の図 2 に示します。

QCNNのテンソルネットワーク表現

さらに、この研究では、GRIM と呼ばれる分散スケーリングを分析するための新しい方法を提案しました。

QCNNアーキテクチャのGRIMモジュール

この研究の意義は何ですか?

QCNN は人工知能の手法として視覚皮質にヒントを得たもので、データセットの重要な特徴を保持しながらデータの次元を削減する一連の畳み込み層とプーリング層を伴います。これらのニューラル ネットワークは、画像認識から材料の発見まで、さまざまな問題を解決するために使用できます。不毛なプラトーを克服することが、AI アプリケーションにおける量子コンピュータの潜在能力を最大限に引き出し、従来のコンピュータに対する優位性を実証するための鍵となります。

論文の共著者の一人であるマルコ・セレゾ氏は、これまで量子機械学習の研究者らは不毛のプラトーの影響を軽減する方法を分析してきたが、それを完全に回避するための理論的根拠が欠けていたと述べた。 LANL の研究は、一部の量子ニューラル ネットワークが実際には不毛なプラトーの影響を受けないことを示している。

「この保証により、研究者は量子システムに関する量子コンピュータのデータを精査し、その情報を物質特性の研究や新素材の発見などに活用できるようになる」とLANLの量子物理学者パトリック・コールズ氏は述べた。

物理学者たちは40年以上もの間、量子コンピュータが量子粒子システムのシミュレーションと理解に役立ち、従来の古典的コンピュータに取って代わると信じてきた。 LANL の研究は、量子シミュレーション データの分析への応用が期待される、堅牢なタイプの量子畳み込みニューラル ネットワークを実証しています。

「レーザーに関する有名な引用があります。レーザーが初めて発見されたとき、人々はそれが問題解決の手段だと言いました。現在、レーザーはあらゆるところで使用されています。同様に、量子データが高度に利用可能になるかどうかについては、多くの人が疑念を抱いています。これは、量子機械学習も普及する可能性があることを意味します」とコールズ氏は語った。

参考リンク: https://discover.lanl.gov/news/releases/1015-quantum-ai

[この記事は51CTOコラム「Machine Heart」、WeChatパブリックアカウント「Machine Heart(id:almosthuman2014)」によるオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  自動運転に関する期限の問題

>>:  IoTセキュリティ戦略における機械学習の重要性

ブログ    
ブログ    

推薦する

...

なぜAIは東京オリンピックでバレーボールの試合を無料で観戦できるのか?

[[416801]]ビッグデータダイジェスト制作出典: Wired 8月8日の夜、第32回夏季オリ...

北京、6つの高速道路を段階的に自動運転試験に開放、安全担当者を段階的に撤退させようとしている

同市は昨年9月に高水準の自動運転実証区を設立したのに続き、インテリジェントコネクテッドカーの政策パイ...

21 世紀においてインテリジェント オートメーションは誇張されすぎているのでしょうか?

[[427549]] Analytics Insight では、21 世紀においてインテリジェント...

データサイエンスについて知っておくべきこと: 10 の重要な概念 + 22 のグラフ

01 バイアスと分散のトレードオフこれは、機械学習における最も重要な理論の中で常に上位にランクされ...

誰もが今から準備すべき、2020 年のキャリアを変える 6 つのテクノロジー トレンド

[51CTO.com クイック翻訳] 新しいテクノロジーの導入により、私たちの職場は変化しています。...

機械学習がオラクルのクラウドアプリケーション戦略の中核に

オラクルの会長兼最高技術責任者(CTO)ラリー・エリソンは本日、Oracle Fusion Clou...

中国人の「専門用語」データセット、AI:あなたはDBQさえ理解していない

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIやIoT技術を活用した企業が職場復帰する際に考慮すべきこと

新型コロナウイルス感染症のパンデミックにより、社会の多くの分野でデジタル変革が加速し、人工知能ツール...

産業用ロボットの開発状況と技術動向を明らかにする

近年、人件費の継続的な上昇に伴い、産業分野では「機械が人に取って代わる」という現象が一般的になり、産...

...

AI は無限であり、あなたの声によって動かされます。マイクロソフトは慈善団体や業界のパートナーと協力し、テクノロジーで愛を育むお手伝いをします。

12月2日、マイクロソフトと周迅のAI音声紅丹丹慈善プロジェクトの発起人である魯音源文化伝承社は、...

ナノロボットは将来さまざまな場面で使用される可能性がある

最近、米国ペンシルベニア州立大学の科学者たちが新しいタイプのナノロボットを開発しました。このロボット...

ヤン・ニン氏の新しい論文が突然ネイチャーのサブジャーナルに掲載された: 構造はAIの手の届かないところにある

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ARMベースの3DES暗号化アルゴリズムの実装(2)

ARMベースのハードウェア実装3DESアルゴリズムと一般的な組み込みアプリケーションの要件に応じて...