1 つの記事でニューラル ネットワークを理解する

1 つの記事でニューラル ネットワークを理解する

[51CTO.com からのオリジナル記事]人工知能は近年非常に人気の高い技術です。99 歳から歩けるようになる年齢まで、誰もが多かれ少なかれ人工知能について知っています。ニューラル ネットワークは人工知能の中核であり、ニューラル ネットワークがなければ人工知能は存在しません。この記事は、ニューラル ネットワークに関連する知識を学ぶのに役立ちます。この記事には数式やコードは含まれておらず、読者がニューラル ネットワークのコア知識を迅速に習得できるようにすることを目的としています。

1. ニューラルネットワークとは何ですか?

  1. 概念ニューラル ネットワークは、複数の単純で高度に接続された要素のシステムであり、各要素は入力に基づいて関連情報を処理します。ニューラル ネットワークは相互接続されたノード (ニューロン) で構成されています。情報は入力層に渡された後、複数の隠れ層で処理され、出力層に渡されて最終処理が行われます。ここで言う最終処理は出力結果となる場合もあれば、次の処理ラウンドのために別のニューラル ネットワークまたはノードに入力データとして渡される場合もあります。 上記のコンテンツではノードについて何度も言及しましたが、ノードとは何でしょうか?ノードはニューロンとも呼ばれ、ニューラル ネットワークの基本単位です。他のノードまたは外部入力ソースから入力データを受信して​​出力データを計算します。各入力データには重みがあり、入力データの重要度に応じて重みが割り当てられます。ノードは入力データを受信すると、入力情報に重みを付けてアクティベーション関数に渡し、アクティベーション関数は最終的な出力データを計算して出力します。

  2. トレーニングの簡単な紹介先ほど、ニューラル ネットワークとノードの概念について説明しました。次に、ニューラル ネットワークがどのようにトレーニングされるかを見てみましょう。簡単に言えば、入力層の入力重みを変更し、隠し層を介してデータを処理し、最後に活性化関数を介してデータを処理します。ニューラル ネットワークの最も一般的な学習スタイルはデルタと呼ばれます。デルタは、学習パターンがニューラル ネットワークに送信されるたびに呼び出される監視ルールであり、この状況をサイクルと呼びます。 ニューラル ネットワークのトレーニングには、エラー率という概念も関係しています。エラー率とは、ニューラル ネットワークに画像を入力したときにニューラル ネットワークが認識するものと正しい答えとの差のことです。ニューラル ネットワークをトレーニングする最も基本的な目的は、エラー率を減らし、各認識を可能な限り 0 に近づけることです。

  3. 勾配降下法エラー率に関して言えば、勾配降下法について言及する必要があります。これは、最急降下法とも呼ばれる一次最適化アルゴリズムです。損失関数を最小化する場合、勾配降下法を使用して段階的に反復し、最小化された損失関数とモデル パラメータ値を取得できます。このアルゴリズムは非常に重要なので、詳しく説明する必要があります。 たとえば、山の奥深くから下りたいのですが、下りる道がどこにあるのかわかりません。そこで、一歩ずつ下りることにし、ある位置に到達するたびに現在の位置の勾配を解き、現在の最も急な位置に沿って一歩下り、次に現在の位置の勾配を解き続けて、最も急で山を下りやすい位置まで歩くことになります。私たちはこのように一歩一歩歩いていき、ついに山のふもとに着いたように感じました。しかし、このまま続けると、山の麓にたどり着くことはできず、代わりに地元の最低地点に到達することになるかもしれません。この説明から、勾配降下法では必ずしもグローバル最適解が見つかるとは限らないが、ローカル最適解が見つかる可能性があることがわかります。

  4. 一般的なニューラル ネットワーク現在、何千ものニューラル ネットワークが知られていますが、その大部分は汎用的ではないため、この部分については説明しません。最も一般的に使用される一般的なニューラル ネットワークは 27 種類ありますが、その中で最も一般的なのは、RNN、パーセプトロン ネットワーク、フィードフォワード ネットワークです。以下に簡単に説明します。

  • RNN RNN は中国語でリカレントニューラルネットワークと呼ばれます。シーケンス内の各要素に対して同じタスクを実行します。出力データは前回の計算に依存し、以前のステップを記録して短期記憶を形成することもできます。彼のイメージは次の通りです:

  • パーセプトロン ネットワーク これは最も単純なニューラル ネットワークです。 隠し層はなく、入力層と出力層のみで構成されます。イメージはおおよそ次のようになります。

  • フィードフォワード ネットワークは、隣接するレイヤーのノード間にエッジを持つ複数のノードで構成され、各エッジには重みがあります。彼はこんな感じです:

2. ニューラルネットワークの学習タイプ

親は子供に多くのことを教えなければなりませんが、すべてを教えることはできません。時には他の手段で学ぶ必要がある場合もあります。この状況は人工知能にも存在するため、ニューラル ネットワークには、教師あり学習、教師なし学習、強化学習という 3 つの異なるタイプの学習があります。

  1. 教師あり学習 教師あり学習の前提条件は、結果が既知のデータセットがあることです。ニューラル ネットワークは、与えられたトレーニング データ セットからモデル パラメータを学習し、新しいデータが到着すると、この関数に基づいて結果を予測できます。データ セットには入力と出力が含まれている必要があり、データ出力情報は人間によって手動でラベル付けされます。教師あり学習は、一般的に分類問題で使用されます。既存のデータセットを通じて最適なモデルをトレーニングし、このモデルを使用してすべての入力を対応する出力にマッピングし、出力に対して簡単な判断を下すことで分類の目的を達成します。一般的な教師あり学習アルゴリズムにはKNNとSVMがある
  2. 教師なし学習データセットにノットがない場合、教師なし学習に適しています。データ間の類似性に応じてデータセットを分類し、各カテゴリ内のギャップを最小限に抑え、各カテゴリ間のギャップを最大化するようにします。その目的は、AI に何をすべきかを指示することではなく、AI が自ら物事を行う方法を学習できるようにすることです。教師なし学習は、一般的に、確率密度関数の推定に基づく直接的な方法と、データ間の類似性測定に基づく簡潔なクラスタリング方法の 2 つのカテゴリに分けられます。確率密度関数推定に基づく直接法では、特徴空間内の各分類の分布パラメータを見つけてから分類を実行します。データ間の類似性測定に基づく単純なクラスタリング手法では、異なる分類のコアと初期カーネルを定義し、データとカーネル間の類似性に応じてデータをさまざまなカテゴリに分割します。
  3. 強化学習強化学習は一般に「アメとムチ」として知られています。簡単に言えば、エラー率の識別が成功すればニンジンが得られ、そうでなければムチで罰せられることになります。環境に応じてどのように行動し、期待される利益を最大化するかを重視する機械学習の分野です。このインスピレーションは心理学の行動主義理論から来ています。環境によって与えられる報酬や罰の刺激を受けて、生物は徐々に刺激に対する期待を形成し、最大の利益を得られる習慣的な行動を生み出します。人工知能では、環境はマルコフ決定プロセスとして設定されることが多いため、多くの強化学習アルゴリズムはこのコンテキストで動的プログラミング手法を使用します。

3. 活性化関数とパーセプトロン

ノードがニューラルネットワークの核だとすると、活性化関数とパーセプトロンはニューラルネットワークの核です。これらはほぼすべてのニューラルネットワークで見られます。このセクションでは、活性化関数とパーセプトロンについて説明します。

  1. 活性化関数 活性化関数は、ニューラル ネットワークの出力に追加され、出力を決定します。出力結果の範囲は通常 -1 から 1 の間です。具体的な値の範囲は、選択した活性化関数によって異なります。最終的には、ニューロンが動作しているかどうかを判断するために使用されます。活性化関数は、データが出力される前の最後の部分であり、出力値のプロバイダーと考えることができます。活性化関数には 2 つのタイプがあり、1 つは線形活性化関数、もう 1 つは非線形活性化関数です。簡単に言うと、線形関数は直線またはほぼ直線上にある関数であり、非線形関数は直線上にない関数です(笑、説明は簡単ですね)
  2. パーセプトロンは、入力が正または 0 の場合は 1 を返し、それ以外の場合は 0 を返す特殊なノードです。この活性化関数を持つノードはパーセプトロンと呼ばれます。それでは、例を通してパーセプトロンについて説明しましょう。 2 つの入力 x1 と x2 を持つパーセプトロンがあります。これら 2 つの入力の重みはそれぞれ w1 と w2 です。これら 2 つの出力に重みを付けます。いわゆる重み付けとは、重みを掛け合わせることを意味します。重みはランダムに割り当てられ、重みの値は -1 から 1 の間です。重み付け後、すべての重みを合計する必要があり、その合計はさらなる処理のための入力として活性化関数に渡されます。次に、活性化関数はパーセプトロンに実行するかどうかを指示します。

4. 逆伝播

これまで説明してきたのは順方向伝播です。順方向伝播の反対は逆方向伝播であり、ニューラル ネットワークの精度を向上させる上で重要な役割を果たします。バックプロパゲーション (エラーバックプロパゲーションとも呼ばれる) は、教師あり学習に勾配降下法を使用するニューラル ネットワーク アルゴリズムの一種です。バックプロパゲーションは、ニューラル ネットワークを逆方向に移動して勾配を計算します。最後のレイヤーの重みの勾配が最初に計算され、最初のレイヤーの勾配が最後に計算されます。後方伝播の計算は、前方段階の活性化関数と出力データに依存します。これらの値は後方伝播が始まる前に計算する必要があるため、後方伝播の前に前方計算を完了する必要があります。 人工知能の分野に初めて入った人にとって、順方向伝播と逆方向伝播は理解しにくいものです。その違いを説明しましょう。データは前方に伝播されて出力を取得し、次に期待値と比較してエラーを取得します。この誤差を最小限に抑えるには、各重みが後方に伝播するたびに誤差導関数を計算し、その誤差導関数を重みから減算する必要があります。順方向伝播を通じて、ニューラル ネットワークの動作を視覚化し、エラーを見つけることができます。エラー率を見つけたら、勾配降下法を使用してバックプロパゲートし、重み値を更新できます。

IV. 結論

この記事の目的は、読者がニューラル ネットワークをすぐに使い始められるようにガイドすることです。ニューラル ネットワークのさまざまな概念を説明し、読者がニューラル ネットワークの概念を深く理解できるようにします。

著者について:

朱剛(ペンネーム:ミャオシュ)は、国内技術ブログの認定エキスパートであり、シニア .NET 開発エンジニアであり、7 年間の最前線開発経験を持っています。電子政府システムや AI カスタマー サービス システムの開発、インターネット求人サイトのアーキテクチャ設計に参加しました。現在はスタートアップ企業に勤務し、エンタープライズ レベルのセキュリティ監視システムの開発に携わっています。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  面接に合格してNLPの扉を開くのに役立つNLPの簡単なガイド

>>:  AIは黄金時代を迎えているのか、それとも冬を迎えようとしているのか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ワイツマンとNVIDIAは、自然言語を使って写真を編集できるText2LIVEを共同でリリースした。

Photoshop のようなソフトウェアを使用することは、創造的な作業とみなされますか、それとも反...

AIがサプライチェーンと物流に与える影響

1. サプライチェーンにおける人工知能の応用テクノロジーの変革の可能性のため、多くの業界で AI の...

校内暴力を予防し解決するために、AIは子どもたちのために何ができるでしょうか?

[[228688]]あなたはキャンパスライフに満足していますか?多くの人が「はい」と答えると思いま...

インテリジェント アシスタントが、設計から運用、保守まで、ソフトウェア開発プロセス全体を処理します。

設計、コーディングからテスト、導入、運用・保守まで、ソフトウェア開発の全プロセスをAIに任せることが...

「人工知能、データサイエンス、機械学習」について語る -- 概要

[[190364]]この記事は、写真付きの 4 つの例を含む 6 時間かけて執筆されました。目的は、...

コンピュータービジョンにおける AI の役割は何ですか?

コンピュータービジョン技術を使用することで、コンピューターは視覚的に物を識別したり確認したりすること...

ディープラーニングの概要: パーセプトロンからディープネットワークまで

近年、人工知能の分野は再び活発化しており、伝統的な学術界に加え、Google、Microsoft、F...

張亜琴氏と張宏江氏は人工知能の将来について何を語っているのでしょうか?

「大規模なシステムを構築するには、体系的な思考、実践的なスキル、システム構築への愛情を持った人材が...

ワークステーションはクライアント側の大規模モデルの「幸せな家」です

MacでSiriを呼び出したことがありますか?とにかく一度も合格していない。 AIの世界では「ベテラ...

GPT-4 の出力がなぜそれほどランダムなのか、深く考えたことはありますか?

今年はAI分野で大規模言語モデル(LLM)が注目され、OpenAIのChatGPTやGPT-4が大人...

...

AI: 世界の終わりか、それとも新しい時代か?

[[273786]] [51CTO.com クイック翻訳] 1980年代のインターネットの出現から...

調査:ブラジルのAIスタートアップの50%以上がサンパウロ州に拠点を置く

ブラジルの新たな調査によると、人工知能関連の製品やサービスの開発に注力している企業の半数以上がサンパ...

IoTと農業: コネクティビティが農業をどう変えるのか

インダストリー 4.0 はよく知られたアイデアですが、アグリカルチャー 4.0 はあまり知られていな...

収穫作業員は月に10万ドルを稼ぐが、誰も雇ってくれないため、英国とオーストラリアの農場はAIに助けを求めている

[[345762]]秋は収穫の季節だが、英国やオーストラリアなどの果樹農家は不安を抱いている。畑では...