記事「バックプロパゲーションを使用した多層ニューラル ネットワークのトレーニングの原理」では、バックプロパゲーションを直感的に理解するための完全な例が提供されています。以下は原文の翻訳です。 この記事では、バックプロパゲーション アルゴリズムを使用して多層ニューラル ネットワークをトレーニングする学習プロセスについて説明します。このプロセスを説明するために、次の図に示すように、2 つの入力と 1 つの出力を持つ 3 層のニューラル ネットワークが使用されます。 各ニューロンは 2 つの部分で構成されています。 *** の部分は入力信号と重み係数の加重合計です。 2 番目の部分は、ニューロン活性化関数と呼ばれる非線形関数です。信号 e は加重和の出力信号 (加算器の出力) です。 y=f(e)は非線形関数(要素)の出力信号です。信号 y はニューロンの出力信号でもあります。 ニューラル ネットワークをトレーニングするには、「トレーニング データセット」が必要です。トレーニング データセットは、ターゲット z (目的の出力) に対応する入力信号 (x_1 および x_2) で構成されます。ニューラル ネットワークのトレーニングは反復的なプロセスです。各反復では、トレーニング データセットからの新しいデータを使用して、ネットワーク ノードの重み係数が変更されます。全体の反復は、順方向計算と逆伝播の 2 つのプロセスで構成されます。 順方向計算: 各学習ステップは、トレーニング セットからの 2 つの入力信号から始まります。順方向計算が完了すると、ネットワークの各層の各ニューロンの出力信号値を決定できます (翻訳者注: トレーニング データ セットには隠し層のターゲット値がないため、隠し層のニューロンにはエラーはありません)。次の図は、信号がネットワークをどのように伝播するかを示しています。シンボル w(xm) は、ネットワーク入力 x_m とニューロン n 間の接続の重みを表します。シンボル y_n はニューロン n の出力信号を表します。 隠れ層信号伝播。シンボル w_mn は、ニューロン m の出力と次の層のニューロン n の入力間の接続重みを表します。 出力層信号伝播: 次のアルゴリズムステップでは、ネットワーク y の出力信号がトレーニング データセットの出力値 (ターゲット) と比較されます。この差は出力層ニューロンのエラー信号 δ と呼ばれます。 隠れ層ニューロンの出力値(トレーニング セットには隠れ層のターゲット値がありません)が不明であるため、内部ニューロンのエラー信号を直接計算することはできません。長年にわたり、多層ニューラル ネットワークをトレーニングするための効果的な方法は見つかっていません。バックプロパゲーションアルゴリズムが開発されたのは 1980 年代半ばになってからでした。バックプロパゲーション アルゴリズムは、エラー信号 δ (単一のトレーニング ステップで計算) をすべてのニューロンに伝播します。各ニューロンに対して、エラー信号がバックプロパゲーションされます。 エラーを伝播するために使用される重み係数 w_mn は、データフローの方向が変更される (信号が出力から入力に 1 つずつ伝播する) ことを除いて、順方向計算で使用される重み係数と同じです。このテクノロジーはすべてのネットワーク層で使用されます。エラーが複数のニューロンから発生した場合は、それらを合計します。下の図に示すように: 各ニューロンに対してエラー信号が計算され、各ニューロンの入力接続の重み係数を変更するために使用されます。以下の式では、df(e)/de はニューロン活性化関数の微分を表します。ニューロン活性化関数の導関数に加えて、重みに影響を与える要因には、逆伝播されたエラー信号と、ニューロン入力方向に接続された前のニューロンが含まれます。 (訳者注:ここでは導出過程は無視し、重みを変更する方法を直接示します。具体的な導出過程については、前回の記事「誤差逆伝播アルゴリズムの簡単な説明」を参照してください。原理は同じで、重みに影響を与える3つの要素が以下の式に反映されています。) 係数 η はネットワークのトレーニング速度に影響します。このパラメータを選択するにはいくつかの手法があります。最初のアプローチは、より大きなパラメータ値から始めることです。重み係数が確立されると同時に、パラメータは徐々に削減されます。 2 番目のアプローチは、小さなパラメータ値でトレーニングを開始することです。トレーニング中、パラメータは徐々に増加し、最終段階で再び減少します。低いパラメータ値でトレーニングプロセスを開始すると、重み係数を決定できます。 [この記事は51CTOのコラムニストであるShitouによるオリジナル記事です。転載する場合は著者のWeChat公開アカウントButianysから許可を得てください。] この著者の他の記事を読むにはここをクリックしてください |
<<: [私はジャービスです]: FaceIDの背後にあるディープラーニング視覚アルゴリズムについて語る
スマートホーム テクノロジーは、家電製品、ホーム セキュリティ、照明、エンターテイメントを強化します...
[51CTO.com クイック翻訳] Heroku Cloud は、Web 開発者や機械学習愛好家の...
要約すると、集中型電力ネットワークは、一日のどの時間でも過負荷にならない安定性を確保するために、特定...
10月16日、OpenAIはひっそりと「コアバリュー」のリストを変更し、これまで明示的に挙げられてい...
アリは小さくても、集団で行動すると侮れません。『アントマン』を観たことがある人なら分かると思います。...
機械学習を使って予測モデルを構築する場合、単に「予測値(点予測)」を知りたいのではなく、「予測値が特...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能 (AI) は世界中の産業に変化をもたらしており、交通も例外ではありません。テクノロジーが進...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ロイターが入手した情報筋や文書によると、ソフトバンクグループは世界的なロボット事業で人員削減を行い、...
人工知能の本質は、機械が人間のように世界を認識し理解できるようにすることです。言語と知識を研究する自...
さまざまな業界の労働者は、当初は AI に取って代わられるのではないかと心配していましたが、今では ...
Google Geminiの写真をめぐる論争はまだ収まらず、さらに衝撃的な内部情報が暴露された。 P...
9月8日現在、コード作成を支援できるAI製品はすでに数多く市場に出回っている。本日の外灘大会サブフォ...