ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

[[428985]]

[51CTO.com クイック翻訳]今日の人工知能の繁栄は、人工ニューラルネットワークに基づくディープラーニングと呼ばれる技術と切り離せません。この記事では、これらのニューラル ネットワークがどのように構築され、トレーニングされるかをグラフィカルに説明します。

図1. アーキテクチャ図

人工ニューラル ネットワーク内の各ニューロンは入力を合計し、活性化関数を適用して出力を決定します。このアーキテクチャは、ニューロンがシナプスを介して互いに信号を伝達する脳内のメカニズムにヒントを得ています。

図2

これは、仮想的なフィードフォワード ディープ ニューラル ネットワーク (複数の隠し層があるため「ディープ」) のアーキテクチャです。この例では、手書きの数字の画像を解釈し、それを 10 個の可能な数字の 1 つに分類するネットワークを示します。

入力層には多数のニューロンが含まれており、それぞれのニューロンには画像内のピクセルのグレースケール値に設定されたアクティベーションがあります。これらの入力ニューロンは次の層のニューロンに接続され、重みと呼ばれる何らかの値で乗算された後にアクティブ化レベルを渡します。 2 番目の層の各ニューロンは、多数の入力を合計し、活性化関数を適用して出力を決定し、同様にフィードフォワードされます。

電車

このニューラル ネットワークは、実際の出力と予想される出力の差を計算することによってトレーニングされます。ここでの数学的最適化問題には、ネットワーク内の調整可能なパラメータ(主にニューロン間の接続の重み、正 [青線] または負 [赤線] になるもの)と同じ数の次元があります。

ネットワークをトレーニングするということは、本質的には、この多次元の「損失」または「コスト」関数の最小値を見つけることです。これは複数回のトレーニングを通じて反復的に実行され、ネットワークの状態が徐々に変化します。実際には、一連のランダムな入力例に対して計算された出力に基づいて、ネットワークの重みに多くの小さな調整を加える必要があり、そのたびに出力層の重みを制御することから始めて、ネットワークを逆方向に進めていきます。 (わかりやすくするために、ここでは各層の 1 つのニューロンに関連付けられた接続のみを示しています。) このバックプロパゲーション プロセスは、損失関数が最小化され、ネットワークが新しい入力に対して可能な限り最良の結果を提供するまで、ランダムなトレーニング例のセットに対して繰り返されます。

図3

図4

ステップ 1 : 入力に手書きの「3」が表示されると、トレーニングされていないネットワークの出力ニューロンがランダムにアクティブ化されます。 3 に関連付けられた出力ニューロンは高い活性化 [暗い陰影] を示し、他の出力ニューロンは低い活性化 [明るい陰影] を示すことが期待されます。したがって、たとえば、3 に関連付けられたニューロンの活性化を増やす必要があります [紫色の矢印]。

図5

ステップ 2 : これを行うには、2 番目の隠し層のニューロンから数字「3」の出力ニューロンへの接続の重みがより正の値になる必要があります [黒い矢印]。変化の大きさは、接続された隠しニューロンのアクティブ化に比例します。

図6

ステップ 3 : 次に、2 番目の隠し層のニューロンに対して同様のプロセスを実行します。たとえば、ネットワークの精度を高めるには、この層の最上位ニューロンの活性化を下げる必要があるかもしれません [緑の矢印]。最初の隠し層への接続の重みを調整することで、ネットワークをその方向に押し進めることができます [黒い矢印]。

図7

ステップ 4 : 次に、最初の隠しレイヤーに対してこのプロセスを繰り返します。たとえば、レイヤーの最初のニューロンをよりアクティブにする必要があるかもしれません [オレンジ色の矢印]。

原題: ディープラーニングの仕組み 今日の AI を支えるニューラルネットワークの内側、著者: サミュエル・K・ムーア、デビッド・シュナイダー、エリザ・ストリックランド

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  人工知能はソフトウェア開発のパラダイムを変えている

>>:  Facebookは人々の生活を一人称で分析する新しいAIシステムを開発中

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

データが足りない場合はどうなりますか?コンピュータビジョンデータ拡張手法の概要

データが足りない場合はどうすればいいですか?学者たちは、ディープラーニングモデルにおけるデータ不足の...

MetaはAIアルゴリズムアプリケーションの透明性を高め、ユーザーに詳細な説明とより多くの選択肢を提供します。

6月30日、ソーシャルメディアプラットフォームはユーザーエクスペリエンスを向上させるためにAIアル...

...

...

人工知能はよりクールで実用的

2021年は間違いなく人工知能産業の発展にとって重要な年となるでしょう。わが国のスマートシティ建設の...

2024年に誰もが備えるべき5つのテクノロジートレンド

機械知能、現実と仮想の境界線の曖昧化、そしてインターネットの継続的な進化は、私たちの生活に根本的な影...

人間の脳をインターネットに接続するときは注意してください

[[264958]]将来、道を歩いていて急にお腹が空いたとき、今のように検索エンジンを使って検索する...

...

ディープラーニングの概要: パーセプトロンからディープネットワークまで

近年、人工知能の分野は再び活発化しており、伝統的な学術界に加え、Google、Microsoft、F...

最新の軌道予測の概要:基本的な定義からさまざまな方法と評価まで

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

「ウイルス」ではなく「情報」を広めよう!プログラマーがAIを使って「手を洗う」を500以上の言語に翻訳

[[321195]]ビッグデータダイジェスト制作ダニエル・ホワイトナック編集者: lin、Cao P...

自動運転車が保険業界に与える影響

自動運転車の急速な発展は、自動車業界や輸送業界を再定義するだけでなく、保険業界にも混乱をもたらすでし...

ハン・ソン、チュー・ジュンヤンらがGAN圧縮方式を提案:計算電力消費は1/9以下、オープンソース化

GAN は大幅に圧縮することもできます。MIT ハン・ソン氏のチームによる最新の研究は、多くの研究者...

CPU と比較して、GPU がディープラーニングに適しているのはなぜですか?

1. CPUとGPUの比較CPUは複数の機能を備えた優れたリーダーです。その利点は、強力なスケジュ...