活性化関数(変換関数とも呼ばれる)は、ニューラル ネットワークを設計するための鍵となります。活性化関数は、ニューラル ネットワークの出力を決定するために使用されるという意味で重要です。結果の値は、関数に応じて 0 から 1 または -1 から 1 などにマッピングされます。活性化関数にはスクワッシング関数と呼ばれる別名があり、活性化関数の範囲が制限されている場合に使用されます。活性化関数はニューラル ネットワークの各ノードに適用され、そのニューロンを「発火」/「活性化」するかどうかを決定します。 活性化関数を選択することがなぜ重要なのか。 活性化関数の選択は、隠し層と出力層に実装するときに重要です。モデルの精度と損失は活性化関数に大きく依存します。さらに、モデルに対する期待に基づいて選択する必要があります。たとえば、バイナリ分類問題では、シグモイド関数が最適な選択です。 活性化関数のタイプ。これらは大まかに 2 つのカテゴリに分けられます。 線形活性化関数。 非線形活性化関数。 表示の便宜上、次のライブラリをインポートします。
シグモイドシグモイド活性化関数はロジスティック関数とも呼ばれます。シグモイド関数は回帰問題や分類問題で非常によく使用されます。シグモイド関数によって与えられる値の範囲は 0 から 1 です。
タンHこの関数はシグモイド活性化関数と非常によく似ています。この関数は、-1 から 1 の範囲の任意の実数値を入力として受け入れ、任意の実数値を出力します。入力が大きい (正の値が大きい) ほど、出力値は 1.0 に近くなり、入力が小さい (負の値が大きい) ほど、出力は -1.0 に近くなります。 Tanh 活性化関数は次のように計算されます。
ソフトマックスSoftmax 活性化関数は、合計が 1.0 になる値のベクトルを出力します。これは、クラス メンバーシップの確率として解釈できます。 Softmax は、尤度出力の「勝者がすべてを獲得する」機能を可能にする argmax 関数の「ソフト」バージョンです。
RELU 整流器リニアユニットReLU はおそらく、隠し層に使用される最も一般的な関数です。また、Sigmoid や Tanh など、以前によく使われていた他の活性化関数の制限を効果的に克服することもできます。具体的には、飽和ユニットなどの他の問題が発生する可能性はあるものの、深層モデルのトレーニングを妨げる勾配降下法消失問題の影響は受けにくくなります。
リーキーReLUReLU の問題: ReLU に負の値が与えられると、すぐにゼロになり、モデルがデータから適切に適合またはトレーニングする能力が低下します。つまり、ReLU 活性化関数への負の入力は、グラフ内でその値を即座にゼロに変換し、その結果、負の値が不適切にマッピングされて結果のグラフに影響を及ぼします。 この問題を克服するために、Leaky ReLU が導入されました。
以下の関数はすべて RELU のバリエーションです。基本的には Leaky に似ており、活性化関数が負の場合に戻り値を最適化します。 エル
セル
シュッシュ
要約するよく使われる隠れ層の活性化関数: 一般的に、リカレント ニューラル ネットワークでは Tanh またはシグモイド活性化関数、あるいはその両方が使用されます。たとえば、LSTM では通常、再帰接続にシグモイド活性化を使用し、出力に Tanh 活性化を使用します。 1. 多層パーセプトロン (MLP): ReLU 活性化関数。 2. 畳み込みニューラル ネットワーク (CNN): ReLU 活性化関数。 3. リカレント ニューラル ネットワーク: Tanh および/またはシグモイド活性化関数。 どの活性化関数を使うべきかわからない場合は、さまざまな組み合わせを試して最適なものを見つけることもできますが、まずはRELUから始めることができます。 出力層の活性化関数: 出力層の活性化関数は、解決しようとしている問題の種類に基づいて選択する必要があります。たとえば、線形回帰の問題がある場合、線形活性化関数が役立ちます。以下は、直面する可能性のある一般的な問題と、使用されるアクティベーション関数です。 バイナリ分類: 1 つのノード、シグモイド活性化。 マルチクラス分類: クラスごとに 1 つのノード、ソフトマックス活性化。 マルチラベル分類: クラスごとに 1 つのノード、シグモイド活性化。 以下は、よく使用される活性化関数の数式と視覚化です。お役に立てば幸いです。 |
<<: これはホログラムではありません!多角度から視聴できる真の3D画像
数年前なら、コンピューターが 10,000 個のニューロンの活動を同時に記録していたらニュースになっ...
サイバー攻撃の巧妙さと深刻さが増すにつれ、IT 業界は協力して、サイバー攻撃からの保護と防止に使用さ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
お父さん、機械学習って何ですか?答えるのは難しい!髪の毛が抜け始めた頭を掻いた後でも、お父さんはこの...
最近、復旦大学の自然言語処理チーム (FudanNLP) が LLM ベースのエージェントに関するレ...
「人工知能+スマート教育」が人気を集めています。しかし、生徒の表情を捉える「スマートアイ」や「顔ス...
調査によると、人工知能(AI)ソリューションは現在急速に成長している市場であり、2020年までに1,...
最近、一連の大規模言語モデル (LLM) が登場しており、そのうち最大のものは 5000 億を超える...
フロアプランは、空間を視覚化したり、ルートを計画したり、建物のデザインを伝えたりするのに役立ちます。...
[[413062]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...
マスク・アンド・予測法は、コンピュータービジョンの分野における新しい流派となるかもしれません。自己教...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...