この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 私たちの生活において、天体観測から MP3 プレーヤーのスペクトルまで、すべてはフーリエ変換なしでは不可能でしょう。 簡単に言えば、離散フーリエ変換 (DFT)とは、複雑な波形を異なる周波数成分に分割することです。 たとえば、音波レコーダーを使用して音を表示すると、実際には、生活の中での音のほとんどは非常に複雑で、混沌としています。 フーリエ変換により、これらの混沌とした音波は正弦波に変換され、私たちが普段目にする音楽スペクトルの姿になります。 しかし、実際の計算では、このプロセスは実は非常に複雑です。 音波を連続関数とみなすと、一連の三角関数の重ね合わせとして一意に表現できます。ただし、重ね合わせのプロセスでは、各三角関数の重み係数が異なります。増やす必要があるものもあれば、減らす必要があるものもあり、増やす必要がないものもあります。 フーリエ変換は、これらの三角関数とそれぞれの重みを求めることです。 なんと偶然でしょう!この検索プロセスはニューラル ネットワークと非常によく似ています。 ニューラル ネットワークの本質は、実際には関数を近似することです。
これは実際に実現可能であり、最近誰かが彼のトレーニングプロセスと結果をオンラインで投稿しました。 DFT = ニューラルネットワークニューラルネットワークをトレーニングするにはどうすればいいですか?このネットユーザーが提示したアイデアは以下の通り。 まず、離散フーリエ変換 (DFT) を人工ニューラル ネットワークとして考えます。これは、バイアスや活性化関数がなく、重みに特定の値を持つ単層ネットワークです。出力ノードの数は、フーリエ変換計算後の周波数の数に等しくなります。 具体的な方法は以下の通りです。 これが DFT です:
信号はすべての正弦波信号の合計として表すことができます。 yk は、信号 x 内の周波数 k の正弦波に関する情報を提供する複素値です。yk から正弦波の振幅と位相を計算できます。 行列形式では、次のようになります。 以下は、k の特定の値に対するフーリエ値です。 ただし、通常は、完全なスペクトル、つまり [0,1,...N-1] の k の値を計算します。これは、行列で表すことができます (k は列ごとに増加し、n は行ごとに増加します)。 簡略化すると次のようになります。 これは、バイアスとアクティベーション関数のないニューラル ネットワーク層なので、見覚えがあるはずです。 指数行列には、複素フーリエ重みと呼ばれる重みが含まれています。通常、ニューラル ネットワークの重みはわかりませんが、ここではわかります。
ニューラル ネットワークでは通常、複素数は使用しません。これに対応するには、行列のサイズを 2 倍にして、左側に実数が含まれ、右側に虚数が含まれるようにする必要があります。 意思 DFT に代入すると次のようになります。 次に、実数部 (余弦形式) を使用して行列の左半分を表し、虚数部 (正弦形式) を使用して行列の右半分を表します。 簡略化すると次のようになります。 意思 これをフーリエ重みといいます。 y^とyは実際には同じ情報を含んでいるが、y^ 複素数は使用されていないため、長さは y の 2 倍になります。 つまり、 または 振幅と位相を表すが、通常は ここで、ネットワークにフーリエ層を追加します。 フーリエ重みを使用してフーリエ変換を計算するニューラルネットワークを使って実装できるようになりました 高速フーリエ変換 (FFT) を使用して正しいことを確認します。
得られた小さな誤差値は、計算された結果が目的のものであることを証明します。
最後に、DFT 後の正弦波信号から再構成された信号と元の信号がうまく重なり合っていることがわかります。 勾配降下法によるフーリエ変換の学習ここで、ニューラル ネットワークが実際に学習する部分が来ます。このステップでは、以前のように重みを事前に計算する必要はありません。 まず、FFT を使用してニューラル ネットワークをトレーニングし、離散フーリエ変換を学習します。
結果は上記の通りであり、ニューラル ネットワークが実際に離散フーリエ変換を学習できることが確認されています。 DFTを学習するためのネットワークのトレーニング高速フーリエ変換法を使用するだけでなく、ネットワークを通じて入力信号を再構築することによって DFT を学習することもできます。 (オートエンコーダと同様)。 オートエンコーダ(AE)は、半教師あり学習や教師なし学習で使用される人工ニューラルネットワーク(ANN)の一種です。その機能は、入力情報を学習対象として、入力情報に対する表現学習を行うことです。
著者はこのモデルで多くのテストを実行しましたが、最終的に得られた重みは上記の例ほどフーリエ重みに近いものではありませんが、再構築された信号は一貫していることがわかります。 代わりに振幅と位相を入力してみましょう。
再構築された信号が再び一貫していることがわかります。 ただし、前と同様に、振幅と位相を入力して得られる最終的な重みは、フーリエ重みとまったく同じではありません(ただし、非常に近い値になります)。 このことから、最終的な重みは最も正確ではないものの、局所的な最適解が得られるという結論が導き出されます。 このようにして、ニューラル ネットワークはフーリエ変換を学習しました。
まず、計算された重みが実際のフーリエ重みとどの程度異なるかが説明されていません。 さらに、モデルにフーリエ層を含めることでどのような利点が得られるのかは明らかではありません。 |
<<: 「コピー+貼り付け」に別れを告げ、ディープラーニングOCRに基づくPDFからテキストへの変換を実現
[[439421]] [51CTO.com クイック翻訳]近年、人工知能(AI)は私たちの日常生活...
GPT-4 の最強の代替品が更新されました!今回、カリフォルニア大学バークレー校は、最新の Llam...
ご存知のとおり、人工知能は計算能力を消費し、多数のデータセンターを必要とします。 しかし、適切な状況...
自動化された機械学習は、過去 1 年間で大きな関心を集めるトピックになりました。 KDnuggets...
GPT と GAN で多くの進歩があったにもかかわらず、AGI は解決が難しい問題のままです。本質的...
コンピューターに頼って悪者を即座に見つけることができれば素晴らしいのですが、問題は AI システムが...
[[327632]] 【51CTO.com クイック翻訳】この質問に対する単純で明確な答えはありま...
ロイター通信によると、6月15日のニュースでは、Googleは生成AIの最も熱心な支持者の1つである...
金融部門は、個人の購入から大規模な取引まで、莫大な富につながる大量の貴重なデータを定期的に生成してお...
Amazonが2006年にEC2サービスをリリースしてから11年が経ちました。この 11 年間で、A...
「ここ数年、情報技術分野で私たちが学んだ最大の教訓の一つは、主要な中核技術は私たち自身の独立したイノ...
【51CTO.comオリジナル記事】スーパーマーケットに入ったところを想像してみてください。計量のた...