[[211834]] 人工ニューラル ネットワーク (ANN) は脳の処理メカニズムに基づいており、複雑なパターン構築および予測の問題に対するアルゴリズムを開発します。 まず、脳がどのように情報を処理するかを理解しましょう。 脳には、電気信号の形で情報を処理する何億ものニューロンがあります。外部の情報や刺激はニューロンの樹状突起で受信され、ニューロン細胞体で処理され、出力に変換され、軸索を通じて次のニューロンに伝達されます。次のニューロンは、信号の強度に応じて、それを受け入れるか拒否するかを選択できます。 それでは、ANN がどのように機能するかを理解してみましょう。 ここで、$w_1$、$w_2$、$w_3$は入力信号の強度を表す。 上でわかるように、ANN は脳のニューロンがどのように機能するかを表す非常に単純な構造です。 わかりやすくするために、簡単な例で ANN を理解しましょう。銀行は顧客への融資申請を承認するかどうかを評価したいので、顧客が融資を滞納する可能性があるかどうかを予測したいと考えています。以下のデータがあります: したがって、列 X を予測する必要があります。予測値が 1 に近いほど、顧客が債務不履行になる可能性が高いことを示します。 次の例のニューロン構造に基づいて、人工ニューラル ネットワーク構造を作成してみてください。 通常、上記の例の単純な ANN 構造は次のようになります。 構造に関する重要なポイント: - ネットワーク アーキテクチャには、入力層、隠し層 (1 つ以上)、および出力層があります。多層構造のため、MLP(多層パーセプトロン)とも呼ばれます。
- 隠し層は、入力からいくつかの重要なパターンを抽出し、次の層に渡す「蒸留層」と考えることができます。これにより、入力から重要な情報を識別し、冗長な情報を省略することで、ネットワークがより高速かつ効率的になります。
- 活性化関数には 2 つの異なる目的があります。
- 入力間の非線形関係を捉える
- 入力をより有用な出力に変換するのに役立ちます。
- 上記の例では、使用されている活性化関数はシグモイドです。
- $$O_1=1+e^{-F}$$
- ここで$F=W_1*X_1+W_2*X_2+W_3*X_3$
- シグモイド活性化関数は、0 から 1 の間の出力を生成します。他にも Tanh、softmax、RELU などの活性化関数があります。
- 同様に、隠れ層は出力層の最終予測を導きます: $$O_3=1+e^{-F_1}$$
- ここで$F_1=W_7*H_1+W_8*H_2$
- ここで、出力値($O_3$)は0〜1の範囲になります。 1 に近い値 (例: 0.75) は、顧客の債務不履行の可能性が高いことを示します。
- 重み W は入力と有意な相関関係があります。 $w_1$ が 0.56 で $w_2$ が 0.92 の場合、$H_1$ を予測するには $X_2$:負債比率が $X_1$:年齢よりも重要になります。
- 上記のネットワーク アーキテクチャは「フィードフォワード ネットワーク」と呼ばれ、入力信号が一方向 (入力から出力へ) にのみ送信されることがわかります。双方向に信号を渡す「フィードバック ネットワーク」を作成することが可能です。
- 精度の高いモデルは、実際の値に非常に近い予測を提供します。したがって、上記の表では、列 X の値は列 W の値に非常に近くなるはずです。予測誤差は列 W と列 X の差です。
- 正確な予測を行う優れたモデルを得るための鍵は、予測誤差を最小限に抑える「重み W の最適値」を見つけることです。これは「バックプロパゲーション アルゴリズム」と呼ばれ、間違いから学習することでモデルが改善されるため、ANN は学習アルゴリズムになります。
- バックプロパゲーションの最も一般的な方法は勾配降下法と呼ばれ、W の異なる値を反復して予測誤差を評価します。したがって、最適な W 値を得るために、W 値を小さな範囲で変化させ、予測誤差の影響を評価します。最終的に、これらの W の値は最適として選択され、W をさらに変更してもエラーはそれ以上減少しません。勾配降下法の詳細については、以下を参照してください。
http://www.kdnuggets.com/2017/04/simple-understand-gradient-descent-algorithm.html ニューラルネットワークの主な利点: ANN には、特定の問題や状況に最適ないくつかの重要な利点があります。 - ANN には、非線形で複雑な関係を学習してモデル化する機能があります。これは、現実の世界では入力と出力の関係の多くが非線形で複雑であるため、非常に重要です。
- ANN は、初期入力とその関係から学習した後、一般化することができ、未知のデータ間の未知の関係を推測することもできるため、モデルは未知のデータを一般化して予測することができます。
- 他の多くの予測手法とは異なり、ANN は入力変数(たとえば、それらの分布方法)にいかなる制限も課しません。さらに、多くの研究により、ANN はデータに固定の関係を課すことなくデータ内の隠れた関係を学習できるため、不均一分散、つまり変動性が高く分散が不安定なデータをより適切にモデル化できることが示されています。これは、データが非常に変動しやすい金融時系列予測(株価など)に非常に役立ちます。
応用: - 画像処理と文字認識: ANN は、多くの入力を受け取り、それらを処理して、隠れた複雑な非線形関係を推測する機能を備えています。ANN は、画像と文字の認識において重要な役割を果たします。手書き文字認識は、詐欺検出(銀行詐欺など)や国家安全保障評価など、さまざまな用途に使用されています。画像認識は、ソーシャル メディアでの顔認識から、医療における癌治療の安定化、農業や防衛目的の衛星画像の処理まで、幅広い用途を持つ成長分野です。現在、ANNの研究はディープニューラルネットワークへの道を切り開き、「ディープラーニング」の基礎となり、無人運転車など、コンピュータービジョン、音声認識、自然言語処理などの分野で一連の刺激的なイノベーションを生み出しています。
- 予測: 予測は、経済政策や金融政策、金融市場や株式市場、日常のビジネス上の意思決定 (販売、製品間の資金配分、生産能力の稼働率など) において広い意味で必要とされます。多くの場合、予測の問題は複雑です。たとえば、株価の予測は、多くの基礎要因 (既知のものもあれば未知のものもある) を伴う複雑な問題です。従来の予測モデルでは、これらの複雑な非線形関係を考慮するのに限界があります。 ANN は、未知の特徴や関係性をモデル化して抽出する能力を備えているため、適切な方法で適用すれば強力な代替手段となります。さらに、これらの従来のモデルとは異なり、ANN は入力と残差の分布にいかなる制限も課しません。 LSTM や RNN を使用した予測の進歩など、さらなる研究が進行中です。
ANN は幅広い用途に使える強力なモデルです。これらはほんの一例ですが、医療、セキュリティ、銀行、金融、政府、農業、防衛などの分野で幅広く応用されています。 |