ハードコア科学: たった一文で、話題の「ニューラルネットワーク」とは何なのか説明できますか?

私の誠意を示すために、この短くて鋭い真実をここに述べます。

ニューラルネットワークは、相互接続された多数のニューロンで構成されたコンピューティングモデルです。

とても複雑ですか?実はとても簡単です。これを読んだ後、あなたはため息をつき、「特別なことじゃない」と言うでしょう。

ニューラルネットワークとは何ですか?運用モデル。

計算モデルとは何ですか?入力値のセットから出力値のセットを計算する方法を記述するモデル。

たとえば、線形方程式 z=2x+3y+5 は、入力が x と y、出力が z である計算モデルです。 z=2x+3y+5 によれば、x と y が与えられると、計算モデルである z が得られます。

出力は複数の値になる可能性があることに注意してください。たとえば、入力が x と y の場合、出力は 2 つの値 z1 と z2 になります。ここで、z1=2x+3y+5、z2=6x+8y+8 です。これも計算モデルと考えることができます。

ニューラルネットワークは計算モデルをどのように表現するのでしょうか?多数のニューロンが相互に接続されています。

下の図はニューラルネットワークを示しています。ニューロンの一番左の垂直列 (青いノード) は入力層と呼ばれ、入力値をインポートする役割を担います。右端のニューロンの縦列 (緑のノード) は出力層と呼ばれ、出力値を導出する役割を担います。中央の 2 列のニューロン (黒いノード) は、隠れ層と呼ばれます。これらのニューロンと、それらの間の接続が計算モデルを表します。

たとえば、線形方程式 z=2x+3y+5 は、以下に示すニューラルネットワークで表すことができます。

図では、2と3は重み値、5はバイアス値と呼ばれます。

一般的に言えば、隠れ層のニューロンへの接続 (ラベル 2 および 3 が付いている接続など) のみに重み値があり、隠れ層のニューロン (ラベル 5 が付いているニューロン) のみにバイアス値があります。重みとバイアスは、通常、ニューラルネットワークでは注釈が付けられません。

ニューラルネットワークでは、ニューロンの数は任意であり、ニューロン間の接続も変化させることができます。

ニューロンとその接続を数式に変換する方法については、ここでは詳しく説明しません。ニューラルネットワークは本質的に計算モデルであることを覚えておいてください。十分な数のニューロンがあれば、非常に複雑な操作、つまり入力と出力の間の非常に複雑な関係を表すことができます。

この時点で、「ニューラルネットワークは、相互接続された多数のニューロンで構成されたコンピューティングモデルである」という定義は非常に明確になっているはずです。

計算モデルを表現するためにニューラルネットワークを使用するのはなぜですか?数式を使うほうが良いのではないでしょうか？

ニューラルネットワークは、入力値と出力値のみがわかっていて、入力値と出力値の関係がわからない状況向けに設計されています。たとえば、x=1 のとき y=2、z=13 であることと、x=2 のとき y=1、z=12 であることしかわかっていませんが、x と y に基づいて z を計算する式はわかりません。

単純な入力と出力の関係に直面すると、方程式を直接解くことができるかもしれません。しかし、極めて複雑な入力と出力の場合はどうでしょうか?たとえば、入力がこの画像のピクセルである場合、出力は画像内のすべての文字になります。これも典型的な画像認識タスクです。

[[361373]]

このとき、ニューラルネットワークが必要になります。ニューラルネットワークが十分に複雑である限り (十分なニューロンと適切なニューロン接続) 、このニューラルネットワークは、取得したい入力値と出力値の関係を表現できると信じることができます。

「可能」とは、ニューラルネットワークが入力値と出力値の関係を正確に表現できるようにする特定の重み値とバイアス値が存在することを意味します。ただし、これらの重みとバイアスの値はわからない場合があります。

ニューラルネットワークが十分に強力であると仮定した場合、重みとバイアスをどのように取得するのでしょうか?

これには、人工知能における最も重要な技術である機械学習における教師あり学習を導入する必要があります。

まず、重みとバイアスの値がランダムに推測され、その後、これらのパラメータが反復的に徐々に更新され、与えられた入力値の下で、ニューラルネットワークの出力値と実際の既知の出力値との差が徐々に減少します。このニューラルネットワークが入力値と出力値の関係を大まかかつ正確に表現できるようになるまで、それが私たちが得ることを望んでいる計算モデルです。

<<: 配達員に代わるドローン配達は、人々に「嫌われるのではなく愛される」ようになる

>>: 2020 年の AI と分析の 5 つの災害