ディープラーニング、ノイズ除去オートエンコーダを使用して生データを予測する方法は?

ディープラーニング、ノイズ除去オートエンコーダを使用して生データを予測する方法は?

[[214638]]

ノイズ除去オートエンコーダー (DAE) は、破損したデータを入力として受け入れ、破損していない元のデータを出力として予測するようにトレーニングされるオートエンコーダーの一種です。

ノイズ除去オートエンコーダのコスト関数の計算グラフ。ノイズ除去オートエンコーダは、破損したバージョン ~x からクリーンなデータ ポイント x を再構築するようにトレーニングされます。これは、損失 L = -log pdecoder(x|h = f(~x)) を最小化することで実現できます。ここで、~x は、破損プロセス C(~x| x) 後のサンプル x の破損バージョンです。

スコア マッチングは *** 尤度に代わるものです。これは、確率分布の一貫した推定値を提供し、モデルがデータ分布と同じスコアを各データ ポイント x で取得するように強制します。

ガウスノイズと平均二乗誤差を再構成誤差として使用する、特定のクラスのノイズ除去オートエンコーダー (シグモイド隠れユニットと線形再構成ユニットを使用) のノイズ除去トレーニング プロセスは、RBM と呼ばれる特定のクラスの無向確率モデルのトレーニングと同等です。

トレーニング サンプル x は、低次元多様体 (太い黒線) の近くに赤い十字として表されます。等確率の損傷プロセス C(~x|x) を表すために灰色の円を使用します。灰色の矢印は、トレーニング例がこの破損プロセスを経た例にどのように変換されるかを示しています。

データが 2D 空間に集中している 1D 曲線多様体の周囲でノイズ除去オートエンコーダによって学習されたベクトル場。各矢印は、再構成されたベクトルからオートエンコーダへの入力ベクトルを引いた値に比例し、暗黙的に推定された確率分布に従ってより高い確率を指します。ベクトル場は、推定密度関数(データ多様体上)の最大値と密度関数の最小値の両方でゼロになります。たとえば、渦巻き腕は局所的最大値が互いに接続された 1 次元多様体を形成します。局所的最小値は、2 つのアームの間の隙間の中央付近で発生します。再構築エラーのノルム(矢印の長さで示される)が大きい場合、矢印の方向に移動すると確率が大幅に増加する可能性があり、これは確率が低い場所ではほとんど当てはまります。オートエンコーダーは、これらの低確率ポイントを高確率の再構築にマッピングします。確率***の場合、再構成がより正確になるため、矢印が縮小します。

現在のところ、ノイズ除去オートエンコーダが確率分布を表現することを学習する方法に限定されています。より一般的には、オートエンコーダを生成モデルとして使用し、その分布からサンプルを取得することが考えられます。

<<:  機械学習はどのような種類のタスクを解決できますか?

>>:  AI人工知能は弱い:あなたを瞬時に複製できる仮想人間が登場

ブログ    
ブログ    

推薦する

Jupyter Notebookの3つの大きな欠点は、この新しいツールによってすべて補われています。

Jupyter は、機械学習とデータサイエンスの分野でよく知られるようになりました。メモ、コード、...

ハンズフリーロボットがゴミ分別の問題解決に役立つ

地球は私たちの共通の家であり、地球環境を保護するために私たちは協力しなければなりません。したがって、...

ガートナーのJi Xinsu氏:AI大手モデルメーカーは今後集中化され、企業が独自に構築するのは経済的ではない

10月11日ニュース(南山)ガートナーは今年7月、「中国ICTハイプサイクル2023」レポートを発表...

ジェンセン・フアン:わずか2年で、Nvidiaと業界全体が完全に変わるだろう

黄仁訓は未来について次のように予言した。コンピューティング技術は10年ごとに100万倍に進歩します。...

CNNとRNNの比較と組み合わせ

CNNとRNNはディープラーニングのほぼ半分を占めているので、この記事ではCNN+RNNとさまざまな...

...

美団におけるナレッジグラフ可視化技術の実践と探究

著者 | 魏耀成魏ナレッジ グラフの視覚化により、ナレッジ グラフ データをより直感的に表示および分...

Daguan Data: ナレッジグラフと Neo4j の簡単な分析

現在のビッグデータ業界では、アルゴリズムのアップグレード、特に機械学習の導入により、「パターン発見」...

AI開発に最適なプログラミング言語トップ5

昨年、アルファ碁が世界中のチェスプレイヤー全員に勝利して以来、人工知能は注目を集めています。先日終了...

2021 年の人工知能のトップ 10 トレンド

コロナウイルスのパンデミック以前、AI業界は2020年に大きな成長を遂げると予想されていました。 2...

...

AI がどのようにして人々に結婚や勉強をするように説得できるかを見てみましょう。

[[361065]]いたずら好きな老人の周伯同は、黄耀師によって桃花島に十数年閉じ込められていまし...

マイクロソフト、中小企業向けにCopilot AIアシスタントを導入、個人向けにプレミアムサービスを開始

マイクロソフトは火曜日、中小企業が同社の生産性向上アプリ内で仮想アシスタント「Copilot」を利用...

SSDの寿命は短いですか?寿命を延ばすバランスアルゴリズム

ハードウェアによって掘られた穴は、本当にソフトウェアによって埋められるのでしょうか?実際、多くのハー...

手紙を開かずに読むことはできますか? MITのX線技術がネイチャー誌に掲載される

2世紀前に折りたたまれた手紙の内容を、開かずに読むにはどうすればよいでしょうか?アルゴリズムはそれを...