ハードコア科学: たった一文で、話題の「ニューラル ネットワーク」とは何なのか説明できますか?

ハードコア科学: たった一文で、話題の「ニューラル ネットワーク」とは何なのか説明できますか?

私の誠意を示すために、この短くて鋭い真実をここに述べます。

ニューラル ネットワークは、 相互接続された多数のニューロン構成されたコンピューティング モデルです

とても複雑ですか?実はとても簡単です。これを読んだ後、あなたはため息をつき、「特別なことじゃない」と言うでしょう。

ニューラルネットワークとは何ですか?運用モデル。

計算モデルとは何ですか?入力値のセットから出力値のセットを計算する方法を記述するモデル。

たとえば、線形方程式 z=2x+3y+5 は、入力が x と y、出力が z である計算モデルです。 z=2x+3y+5 によれば、x と y が与えられると、計算モデルである z が得られます。

出力は複数の値になる可能性があることに注意してください。たとえば、入力が x と y の場合、出力は 2 つの値 z1 と z2 になります。ここで、z1=2x+3y+5、z2=6x+8y+8 です。これも計算モデルと考えることができます。

ニューラル ネットワークは計算モデルをどのように表現するのでしょうか?多数のニューロンが相互に接続されています。

下の図はニューラルネットワークを示しています。ニューロンの一番左の垂直列 (青いノード) は入力層と呼ばれ、入力値をインポートする役割を担います。右端のニューロンの縦列 (緑のノード) は出力層と呼ばれ、出力値を導出する役割を担います。中央の 2 列のニューロン (黒いノード) は、隠れ層と呼ばれます。これらのニューロンと、それらの間の接続が計算モデルを表します。

たとえば、線形方程式 z=2x+3y+5 は、以下に示すニューラル ネットワークで表すことができます。

図では、2と3は重み値、5はバイアス値と呼ばれます。

一般的に言えば、隠れ層のニューロンへの接続 (ラベル 2 および 3 が付いている接続など) のみに重み値があり、隠れ層のニューロン (ラベル 5 が付いているニューロン) のみにバイアス値があります。重みとバイアスは、通常、ニューラル ネットワークでは注釈が付けられません。

ニューラル ネットワークでは、ニューロンの数は任意であり、ニューロン間の接続も変化させることができます。

ニューロンとその接続を数式に変換する方法については、ここでは詳しく説明しません。ニューラル ネットワークは本質的に計算モデルであることを覚えておいてください。十分な数のニューロンがあれば、非常に複雑な操作、つまり入力と出力の間の非常に複雑な関係を表すことができます

この時点で、「ニューラル ネットワークは、相互接続された多数のニューロンで構成されたコンピューティング モデルである」という定義は非常に明確になっているはずです。

計算モデルを表現するためにニューラル ネットワークを使用するのはなぜですか?数式を使うほうが良いのではないでしょうか?

ニューラル ネットワークは、入力値と出力値のみがわかっていて入力値と出力値の関係がわからない状況向けに設計されています。たとえば、x=1 のとき y=2、z=13 であることと、x=2 のとき y=1、z=12 であることしかわかっていませんが、x と y に基づいて z を計算する式はわかりません。

単純な入力と出力の関係に直面すると、方程式を直接解くことができるかもしれません。しかし、極めて複雑な入力と出力の場合はどうでしょうか?たとえば、入力がこの画像のピクセルである場合、出力は画像内のすべての文字になります。これも典型的な画像認識タスクです。

[[361373]]

このとき、ニューラルネットワークが必要になります。ニューラル ネットワークが十分に複雑である限り (十分なニューロンと適切なニューロン接続) 、このニューラル ネットワークは、取得したい入力値と出力値の関係を表現できると信じることができます。

「可能」とは、ニューラル ネットワークが入力値と出力値の関係を正確に表現できるようする特定の重み値とバイアス値が存在することを意味します。ただし、これらの重みとバイアスの値はわからない場合があります。

ニューラル ネットワークが十分に強力であると仮定した場合、重みとバイアスをどのように取得するのでしょうか?

これには、人工知能における最も重要な技術である機械学習における教師あり学習を導入する必要があります。

まず、重みとバイアスの値がランダムに推測され、その後、これらのパラメータが反復的に徐々に更新され、与えられた入力値の下で、ニューラル ネットワークの出力値と実際の既知の出力値との差が徐々に減少します。このニューラル ネットワークが入力値と出力値の関係を大まかかつ正確に表現できるようになるまで、それが私たちが得ることを望んでいる計算モデルです。

<<:  配達員に代わるドローン配達は、人々に「嫌われるのではなく愛される」ようになる

>>:  2020 年の AI と分析の 5 つの災害

ブログ    
ブログ    
ブログ    

推薦する

2021年6月の人工知能分野における重要な進展の概要

人工知能は、人間の理論、方法、技術、アプリケーション システムをシミュレート、拡張、拡大するために使...

Tableau の 157 億ドルの買収の背後にある、50 ページの詳細なレポートが BI の未来を明らかにする

レポート概要BIビジネスインテリジェンスの核心は、意思決定の価値を反映することです。 • 企業のデジ...

Python 機械学習の実践: クレジットカード詐欺検出

ストーリーの背景:元のデータは個人の取引記録ですが、データ自体のプライバシーを考慮して、元のデータは...

人工知能が未来の学校を再構築し、教育問題の解決に貢献

スティーブ・ジョブズはかつて、世間では「スティーブ・ジョブズの質問」と呼ばれている、と発言しました。...

今後 10 年間で人工知能が私たちの生活を支配するようになるとき、携帯電話はどのようなものになるでしょうか?

テクノロジー業界のほとんどの人は、今後 10 年以内にユビキタス テクノロジーが 1 日のあらゆる瞬...

ChatGPTの曖昧な問題への対応力を高める方法についてお話ししましょう

ヒント エンジニアリング技術は、大規模な言語モデルが検索強化型生成システムで代名詞などの複雑なコア参...

18年経った今、マイクロソフトの自然言語処理技術はどうなっているのでしょうか?

[51CTO.com からのオリジナル記事] 自然言語処理は、人工知能の開発において常に克服しなけ...

NetEase はデータ指標の異常をどのように検出し、診断するのでしょうか?

1. 背景指標はビジネスと密接に関係しており、その価値は、問題点やハイライトを発見し、タイムリーに...

プロジェクト管理における人工知能の役割

人工知能 (AI) の台頭とさまざまな業界への統合の増加に伴い、プロジェクト管理も進化しています。 ...

GitHub Copilotが3回アップデート:コード行で直接質問できるようになり、コンテキスト範囲がターミナルまで拡張される

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

エンジニアはETLを書くべきか? - 効率的なアルゴリズム/データサイエンス部門の構築方法を教えます

[[174647]]序文多くのインターネット企業のアルゴリズム関連部門(検索、レコメンデーション、広...

高性能な MongoDB データ移行ツールの構築: Java 開発の実践

ビッグデータ時代の到来により、データ移行は多くの企業や組織が直面しなければならない課題の 1 つにな...

ビッグデータと人工知能の関係、総合的な分析

ビッグデータはクラウドコンピューティングを採用PaaS レイヤーの複雑な汎用アプリケーションは、ビッ...