この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 私たちの生活において、天体観測から MP3 プレーヤーのスペクトルまで、すべてはフーリエ変換なしでは不可能でしょう。 簡単に言えば、離散フーリエ変換 (DFT)とは、複雑な波形を異なる周波数成分に分割することです。 たとえば、音波レコーダーを使用して音を表示すると、実際には、生活の中での音のほとんどは非常に複雑で、混沌としています。 フーリエ変換により、これらの混沌とした音波は正弦波に変換され、私たちが普段目にする音楽スペクトルの姿になります。 しかし、実際の計算では、このプロセスは実は非常に複雑です。 音波を連続関数とみなすと、一連の三角関数の重ね合わせとして一意に表現できます。ただし、重ね合わせのプロセスでは、各三角関数の重み係数が異なります。増やす必要があるものもあれば、減らす必要があるものもあり、増やす必要がないものもあります。 フーリエ変換は、これらの三角関数とそれぞれの重みを求めることです。 なんと偶然でしょう!この検索プロセスはニューラル ネットワークと非常によく似ています。 ニューラル ネットワークの本質は、実際には関数を近似することです。
これは実際に実現可能であり、最近誰かが彼のトレーニングプロセスと結果をオンラインで投稿しました。 DFT = ニューラルネットワークニューラルネットワークをトレーニングするにはどうすればいいですか?このネットユーザーが提示したアイデアは以下の通り。 まず、離散フーリエ変換 (DFT) を人工ニューラル ネットワークとして考えます。これは、バイアスや活性化関数がなく、重みに特定の値を持つ単層ネットワークです。出力ノードの数は、フーリエ変換計算後の周波数の数に等しくなります。 具体的な方法は以下の通りです。 これが DFT です:
信号はすべての正弦波信号の合計として表すことができます。 yk は、信号 x 内の周波数 k の正弦波に関する情報を提供する複素値です。yk から正弦波の振幅と位相を計算できます。 行列形式では、次のようになります。 以下は、k の特定の値に対するフーリエ値です。 ただし、通常は、完全なスペクトル、つまり [0,1,...N-1] の k の値を計算します。これは、行列で表すことができます (k は列ごとに増加し、n は行ごとに増加します)。 簡略化すると次のようになります。 これは、バイアスとアクティベーション関数のないニューラル ネットワーク層なので、見覚えがあるはずです。 指数行列には、複素フーリエ重みと呼ばれる重みが含まれています。通常、ニューラル ネットワークの重みはわかりませんが、ここではわかります。
ニューラル ネットワークでは通常、複素数は使用しません。これに対応するには、行列のサイズを 2 倍にして、左側に実数が含まれ、右側に虚数が含まれるようにする必要があります。 意思 DFT に代入すると次のようになります。 次に、実数部 (余弦形式) を使用して行列の左半分を表し、虚数部 (正弦形式) を使用して行列の右半分を表します。 簡略化すると次のようになります。 意思 これをフーリエ重みといいます。 y^とyは実際には同じ情報を含んでいるが、y^ 複素数は使用されていないため、長さは y の 2 倍になります。 つまり、 または 振幅と位相を表すが、通常は ここで、ネットワークにフーリエ層を追加します。 フーリエ重みを使用してフーリエ変換を計算するニューラルネットワークを使って実装できるようになりました 高速フーリエ変換 (FFT) を使用して正しいことを確認します。
得られた小さな誤差値は、計算された結果が目的のものであることを証明します。
最後に、DFT 後の正弦波信号から再構成された信号と元の信号がうまく重なり合っていることがわかります。 勾配降下法によるフーリエ変換の学習ここで、ニューラル ネットワークが実際に学習する部分が来ます。このステップでは、以前のように重みを事前に計算する必要はありません。 まず、FFT を使用してニューラル ネットワークをトレーニングし、離散フーリエ変換を学習します。
結果は上記の通りであり、ニューラル ネットワークが実際に離散フーリエ変換を学習できることが確認されています。 DFTを学習するためのネットワークのトレーニング高速フーリエ変換法を使用するだけでなく、ネットワークを通じて入力信号を再構築することによって DFT を学習することもできます。 (オートエンコーダと同様)。 オートエンコーダ(AE)は、半教師あり学習や教師なし学習で使用される人工ニューラルネットワーク(ANN)の一種です。その機能は、入力情報を学習対象として、入力情報に対する表現学習を行うことです。
著者はこのモデルで多くのテストを実行しましたが、最終的に得られた重みは上記の例ほどフーリエ重みに近いものではありませんが、再構築された信号は一貫していることがわかります。 代わりに振幅と位相を入力してみましょう。
再構築された信号が再び一貫していることがわかります。 ただし、前と同様に、振幅と位相を入力して得られる最終的な重みは、フーリエ重みとまったく同じではありません(ただし、非常に近い値になります)。 このことから、最終的な重みは最も正確ではないものの、局所的な最適解が得られるという結論が導き出されます。 このようにして、ニューラル ネットワークはフーリエ変換を学習しました。
まず、計算された重みが実際のフーリエ重みとどの程度異なるかが説明されていません。 さらに、モデルにフーリエ層を含めることでどのような利点が得られるのかは明らかではありません。 |
<<: 「コピー+貼り付け」に別れを告げ、ディープラーニングOCRに基づくPDFからテキストへの変換を実現
近年、ドローン業界は非常に急速な発展を遂げていると言えます。製品面では数量が大幅に増加し、種類もます...
正直に言うと、私はロボット犬の技をたくさん見てきました -しかし、私は今日も驚きました。 CMU の...
翻訳者|朱 仙中レビュー | Chonglou導入携帯電話、気候センサー、金融市場取引、車両や輸送コ...
テクノロジーとイノベーションがダイナミックに変化する中、人工知能 (AI) の研究は学生や専門家にと...
2019年5月15日、深センIoTロックテクノロジー株式会社は北京金宇シェラトンホテルで「nokel...
将来的には、ML 製品の構築がより楽しくなり、これらのシステムはより良く機能するようになります。 M...
今日は、go-openai を使用して chatGPT を呼び出すという興味深いトピックを皆さんと共...
事前のプログラミングやトレーニングなしで GPT-4 を使用してヒューマノイド ロボットを制御すると...
2023年の夏は終わったが、AIGCビッグモデルを巡る注目は衰える気配がない。過去 6 か月間、私...
近年、急速に発展している人工知能の分野のひとつであるディープラーニングは、NLP、画像認識、音声認識...
最近またFaceAPPが人気になってきているので、編集者もダウンロードして試してみました。大丈夫です...
ニューヨーク大学の心理学教授であるゲイリー・マーカス氏は、かつてウーバーの人工知能研究所の所長を務め...
人工知能や機械学習 (AI/ML) をトレーニングするために現実世界のデータを収集することは、時間が...