ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

ディープラーニングの仕組み: 今日の AI を支えるニューラル ネットワークの内部を覗いてみよう

[[428985]]

[51CTO.com クイック翻訳]今日の人工知能の繁栄は、人工ニューラルネットワークに基づくディープラーニングと呼ばれる技術と切り離せません。この記事では、これらのニューラル ネットワークがどのように構築され、トレーニングされるかをグラフィカルに説明します。

図1. アーキテクチャ図

人工ニューラル ネットワーク内の各ニューロンは入力を合計し、活性化関数を適用して出力を決定します。このアーキテクチャは、ニューロンがシナプスを介して互いに信号を伝達する脳内のメカニズムにヒントを得ています。

図2

これは、仮想的なフィードフォワード ディープ ニューラル ネットワーク (複数の隠し層があるため「ディープ」) のアーキテクチャです。この例では、手書きの数字の画像を解釈し、それを 10 個の可能な数字の 1 つに分類するネットワークを示します。

入力層には多数のニューロンが含まれており、それぞれのニューロンには画像内のピクセルのグレースケール値に設定されたアクティベーションがあります。これらの入力ニューロンは次の層のニューロンに接続され、重みと呼ばれる何らかの値で乗算された後にアクティブ化レベルを渡します。 2 番目の層の各ニューロンは、多数の入力を合計し、活性化関数を適用して出力を決定し、同様にフィードフォワードされます。

電車

このニューラル ネットワークは、実際の出力と予想される出力の差を計算することによってトレーニングされます。ここでの数学的最適化問題には、ネットワーク内の調整可能なパラメータ(主にニューロン間の接続の重み、正 [青線] または負 [赤線] になるもの)と同じ数の次元があります。

ネットワークをトレーニングするということは、本質的には、この多次元の「損失」または「コスト」関数の最小値を見つけることです。これは複数回のトレーニングを通じて反復的に実行され、ネットワークの状態が徐々に変化します。実際には、一連のランダムな入力例に対して計算された出力に基づいて、ネットワークの重みに多くの小さな調整を加える必要があり、そのたびに出力層の重みを制御することから始めて、ネットワークを逆方向に進めていきます。 (わかりやすくするために、ここでは各層の 1 つのニューロンに関連付けられた接続のみを示しています。) このバックプロパゲーション プロセスは、損失関数が最小化され、ネットワークが新しい入力に対して可能な限り最良の結果を提供するまで、ランダムなトレーニング例のセットに対して繰り返されます。

図3

図4

ステップ 1 : 入力に手書きの「3」が表示されると、トレーニングされていないネットワークの出力ニューロンがランダムにアクティブ化されます。 3 に関連付けられた出力ニューロンは高い活性化 [暗い陰影] を示し、他の出力ニューロンは低い活性化 [明るい陰影] を示すことが期待されます。したがって、たとえば、3 に関連付けられたニューロンの活性化を増やす必要があります [紫色の矢印]。

図5

ステップ 2 : これを行うには、2 番目の隠し層のニューロンから数字「3」の出力ニューロンへの接続の重みがより正の値になる必要があります [黒い矢印]。変化の大きさは、接続された隠しニューロンのアクティブ化に比例します。

図6

ステップ 3 : 次に、2 番目の隠し層のニューロンに対して同様のプロセスを実行します。たとえば、ネットワークの精度を高めるには、この層の最上位ニューロンの活性化を下げる必要があるかもしれません [緑の矢印]。最初の隠し層への接続の重みを調整することで、ネットワークをその方向に押し進めることができます [黒い矢印]。

図7

ステップ 4 : 次に、最初の隠しレイヤーに対してこのプロセスを繰り返します。たとえば、レイヤーの最初のニューロンをよりアクティブにする必要があるかもしれません [オレンジ色の矢印]。

原題: ディープラーニングの仕組み 今日の AI を支えるニューラルネットワークの内側、著者: サミュエル・K・ムーア、デビッド・シュナイダー、エリザ・ストリックランド

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  人工知能はソフトウェア開発のパラダイムを変えている

>>:  Facebookは人々の生活を一人称で分析する新しいAIシステムを開発中

ブログ    

推薦する

人工知能は企業の組織化の方法をどのように変えるのでしょうか?

[[184562]]企業への人工知能の浸透はまだ始まったばかりですが、すでにビジネスリーダーたちは...

6つの主要なソートアルゴリズム

6 つの一般的なソート アルゴリズムの GIF アニメーションがあり、ソートの考え方をより簡単に理解...

人工知能技術の発展の概要

[[352219]]人工知能は、コンピュータサイエンス業界のトップテクノロジーの一つとして、1956...

強化学習と3Dビジョンを組み合わせた新たなブレークスルー:高性能オンラインパレタイジングロボット

国立防衛技術大学、クレムソン大学、Seebit Robotics の研究者らが協力し、深層強化学習を...

...

ソラのトレーニングデータが流出した疑い、ネットユーザー「UE5が間違いなく使われている」

朗報です、朗報です、本物のソラの新しいビデオがあります!通りかかったらぜひお見逃しなく! (本物のS...

スマートシティで人工知能の可能性を最大限に引き出すにはどうすればよいでしょうか?

スマート シティ コンセプトの中心にあるのは、情報通信技術 (ICT) の力を活用して都市の課題に対...

...

大規模機械学習の台頭と「ゼロトラスト」アーキテクチャの出現、2021年の9つの主要な技術トレンド

[[373625]]このほど、デロイト マネジメント コンサルティングは「2021 年テクノロジー ...

...

人工知能の時代に著作権はどのように機能するのでしょうか?

今日、私たちはあらゆるツールを利用でき、AI を使って望むものを何でも作成する自由と力を持っています...

サーバーレス コンピューティングによる機械学習の解決策は何でしょうか?

1. 機械学習とサーバーレス学習1.1. 機械学習 (ML) はアプリケーション シナリオでどのよ...

マイクロソフトCEOナデラ氏:私は4つの大きな変革を経験してきたが、AIは5番目だ

マイクロソフトのサティア・ナデラCEOは10月23日、メディアのインタビューで、同社はこれまで4つの...

企業の78%が2022年までにAIを主要な収益源と見なしている

SambaNova Systems が調査した企業の大多数は、2022 年までに AI を主要な収...