この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)から転載したものです。 人工知能は世界を席巻しており、いわゆる「機械学習アルゴリズム」はあらゆるレベルの現代技術に浸透し、革新というより義務となっている。現在使用されている機械学習アルゴリズムは、真の AI と呼べるほど自律的であるかどうか議論する人もいるかもしれませんが、この議論は範囲が広すぎるため、この記事の焦点ではありません。 この記事では、ニューラル ネットワークと人間の心の間の深い複雑さと深い関係を探ってみます。 Google で入力を始めると、ブラウザはどのようにしてあなたが探しているものを推測するのでしょうか。モバイル カメラは、写真と呼ばれる小さなピクセルの海の中で、どのようにして顔を認識するのでしょうか。Alexa、Siri、Google Home などの仮想アシスタントは、会議のスケジュール設定、天気情報の取得、就寝前の物語の読み聞かせなどの複雑なタスクをどのように実行するのでしょうか。 これらすべての質問に対する答えは機械学習、より具体的にはニューラル ネットワークです。
ニューラルネットワークとは何ですか? このセクションでは、ディープラーニングについて何も知らない人に、基本的なニューラル ネットワークとは何かを説明することを目的としています。実際に関わる数学はもっと複雑ですが、ここでのポイントは、ニューラル ネットワークがどのように機能するかということではなく、むしろそれが人間の心とどのように関係しているかを理解することです。 ニューロン ニューロンはニューラル ネットワークの中で最も単純な単位です。ニューロンが行うことは、前の層のすべてのニューロン(この場合、前の層の青で示されるニューロン y、つまり x1、x2、x3 など)から入力値を受け取り、各入力値に、その入力値の元のニューロンに関連付けられた重みを掛け合わせることです。つまり、ここでは x1 が w1 で乗算され、x2 が w2 で乗算され、以下同様に、これらすべての乗算がニューロン y 内で加算されます。 y=x1.w1 + x2*w2 +x3*w3……xm.wm この合計は、Sigmoid、tanH、ReLU などの活性化関数を使用して出力値に変換されます。では、これらの活性化関数とは何でしょうか? 以下はシグモイド活性化関数の例です。 シグモイド活性化関数 シグモイド活性化関数は、任意の入力値 (この場合、合計 y はシグモイド関数の入力値) を 0 ~ 1 の範囲の値に変換します。とても簡単です。入力値とそれぞれの重みを活性化関数に追加するだけです。ニューロンは出力値を生成します。 シンプルなニューラルネットワーク これはニューラル ネットワークとしては最も単純なものです。ご覧のとおり、ここにある灰色の円はそれぞれニューロンであり、このニューラル ネットワークには入力層、隠れ層、出力層の 3 つの層があります。 さて、ニューラル ネットワークはタスクを独自に処理する方法を学習しますが、どのように学習するのでしょうか。もちろん、データを通じて学習します。データからの学習については次のセクションで詳しく説明しますが、現時点では、データが入力層を介してニューラル ネットワークに入力され、中間層で処理され、出力層によって出力されることがわかっています。 画像を猫と犬に分類するニューラルネットワーク たとえば、ニューラル ネットワークに画像から猫と犬を認識させたい場合は、猫と犬のラベル付き画像 (ラベル付き画像はニューラル ネットワークに正しい答えを与えることを意味します) をニューラル ネットワークに入力して処理し、ニューラル レイヤーがそれが猫であるか犬であるかを推測します。これで、画像に対する答えが得られたので、精度を向上できるように異なるニューロン間の重みを調整します。 人間の心 - 巨大な神経ネットワーク 幼児が遊んでいるところを観察したことはありますか? 彼らはいつも好奇心旺盛で、周囲の世界と交流することに熱心です。幼い子どもの脳は、生まれてすぐに学習を始める、単純で訓練されていない神経ネットワークのようなものです。ニューラル ネットワークは初期段階では非常に単純なため、幼児が最初に学ぶことは、移動する、食べる、這うなどの非常に基本的なタスクを完了することです。 幼児がボールを持つと、その重さ、形、持ったときの感触、皮膚の周りの変化に気づきます。この観察は彼の初期の学習プロセスの一部であり、実際に彼の学習を助けました。ボールで遊ぶ幼児は脳を鍛え、次の活動に備えます。
画像ソース: unsplash 今では、ボールを見ると、それが何であるか、そしてボールを握って投げるとどんな感じがするかを思い出します。子どもたちがボールで遊ぶ回数が増えるにつれて、トレーニングが形成されていきます。 10代の若者は、ボールで遊んだり投げたりすることにほぼ熟達しており、ボールを投げることは非常に簡単な作業だと思う人もいるかもしれませんが、そのための学習は決して近道ではありません。 前述したように、子どもの脳は歩く、食べる、話すなどの基本的な動作を実行する単純なニューラル ネットワークのようなものです。子どもが成長するにつれて、手と目の協調、流暢な会話、こぼさずに食べることなど、より複雑なプロセスを学びます。 ニューラル ネットワークのトレーニング経験がある人は、単純なネットワークのトレーニングは比較的簡単だと考えていますが、ニューラル レイヤーが追加され、データと端末出力が複雑になるにつれて、学習が遅くなります。幼少期は、新しいスキルを学ぶのに最適な時期です。なぜなら、幼少期の神経ネットワークは大人に比べて単純で、脳が訓練されていないため、ニューロンを自分の意志に従わせるのが簡単だからです。 子どもが成長するにつれて、課題がより複雑になり、学習はより困難になります。たとえば、難しい問題を解決したり、決定や判断を下したりすることは複雑な作業であり、大人になっても私たちは学び、成長し続けます。脳は常に学習していますが、この学習は具体的にどのように起こるのでしょうか? 答えは、脳は自ら形を変えるということです。ニューラル ネットワーク内のニューロン間の重みと接続が変化するのと同様に、脳は数十億のニューロン間の接続も変化させ、複雑なニューラル ネットワークが以前に受けたトレーニングを保持するだけでなく、それを基に構築できるようにして、最終プロセスの複雑さを増します。 これを読んでいると、あなたの脳内のすべてのニューロンが変化し、他の何十億ものニューロンとのつながりが変わり、あなたが生まれてから得た経験に新たな経験が加わります。そうやって学ぶのです。学習するたびに、脳はニューラル ネットワークをトレーニングするのと同じようなプロセスで自らを形成します。 データこそがすべて 今日、テクノロジー大手にとって、消費者ベースのデータほど重要なものはありません。その理由は、データ駆動型の「機械学習アルゴリズム」です。データはニューラル ネットワークをトレーニングします。データがなければ学習は不可能です。次の確認コードに遭遇したはずです: 画像ソース: unsplash このキャプチャに答えるのはあなたにとっては簡単かもしれませんが、子供に答えてもらうと、正しく答えても非常に遅くなるかもしれません。実際、Web 上でこのような CAPTCHA に回答するたびに、ロボットやニューラル ネットワークのトレーニングに協力することになります。実際に役立つデータの準備とモデルのトレーニングに協力していることになります。多数の非自明なモデルをトレーニングしたと言えます。 人工的に作り上げたモデルのために準備するデータが最も重要であるのと同様に、人間の心もまた、人生のあらゆる瞬間に大量のデータを取り込む貪欲なネットワークです。データはあなたを構築し、学習を助け、あなたをインテリジェントなマシンに変えます。これで、人間の脳が周囲のデータ、つまり入力層または五感から学習する最終レベルに到達します。 五感 ニューラル ネットワークには入力層があり、データはモデルの形式でネットワークに入力され、ネットワークはそれを理解して処理します。次に、データはトレーニングのために隠れ層に渡され、重みが変更され、最終的に出力層が予測を行い、猫か犬かを区別するか、学習した単語に基づいて文を完成させるかを決定します。 人間の心を巨大なニューラル ネットワークに例えると、このネットワークにも入力層があるかどうかは明らかです。視覚、聴覚、触覚、味覚、嗅覚の五感は脳への入力層を形成します。 視覚は五感の中で最も重要です。なぜなら、最も大きなデータの変化はこの感覚からもたらされるからです。ニューラル ネットワークのトレーニングに最適なデータ セットには、1 種類のデータだけでなく、さまざまな種類のデータと例が含まれています。データが 1 種類しかない場合、モデルが過剰適合する可能性があります。つまり、データがトレーニングに使用されたものと同じ種類のものである場合は正しい結果が得られるかもしれませんが、データがトレーニング データの標準から逸脱すると、精度が脅かされます。 人生における最も重要な学習プロセスにおいて、目は最も活発に働きます。歩くことから食べることまで、自転車に乗ることを学ぶことからピアノを弾くことまで、他の人と交流することからコンピューターで入力することまで、ほとんどすべての作業には目が必要です。 聴覚もまた重要であり、これは、人間が荒野で食料を探さなければならなかった過去にはさらに明らかであり、耳は獲物が発する音に集中し、その生存はこの感覚に依存していました。 触覚もまた、人間が持つ最も貴重な感覚の一つです。それは、私たちの手を熱いストーブから遠ざけ、赤ちゃんに沸騰したミルクを与えるのを防ぎ、人間が触りたい物に触れることを可能にします。 嗅覚と味覚は人間の神経ネットワークの基本的な学習にはあまり貢献しませんが、それ自体に価値があります。これらの感覚は、人生の成長と学習の過程における楽しみの探求を促進します。花の香りを嗅ぐこと、上質なワインのまろやかさを味わうこと、豊かな人生を感じること、これらはすべて嗅覚と味覚を通じて得られるものです。 これで、入力層、データ、およびすべての処理が行われるニューラル ネットワークについて理解できました。すべてのパズルのピースを組み合わせて全体像を見るもう一つの例は、パターン認識です。 パターン認識 読み書きの学習を例に挙げてみましょう。ここで最も重要な感覚は目です。子どもたちはアルファベットを学び、文字を何度も見て、発音したり書いたりすることで、読むことを学びます。読む、話す、書くたびに、脳を鍛え、アルファベットを完全に書けるまで正確さを向上させていきます。 比較的単純なニューラル ネットワークのトレーニングの後、子供は聴覚が主な役割を果たすようになり、単語をつなぎ合わせます。これらの作品を参照すると、彼はこれらの単語のパターン、つまり 26 個の文字がさまざまな方法で組み合わさって英語を構成する膨大な数の単語を形成する方法を認識し始めます。 このパターン認識は重要であり、子供が顔、動物、またはおもちゃを認識するのに役立ちます。パターン認識は成人にとって非常に強力になっており、成人は広範囲にわたる訓練を受け、膨大な量のデータを処理し、周囲のパターンを認識できるようにしています。経験に基づいて雨が降るかどうかを予測することと、記憶と経験に基づいて出来事の結果を予測することは、どちらもパターン認識です。ホームズはモリアーティ教授の袖にチョークの粉がついていたことから、キャラバンの中で彼を発見したが、これもパターン認識である。
最初にニューラルネットワークの仕組みを説明し、次に人間の心と比較しましたが、実際はその逆です。人間の心がニューラルネットワークにインスピレーションを与えます。そうでなければ、なぜこれらの小さな機能がニューロンと呼ばれるのでしょうか。 人間の心は、世界中のあらゆる思考、行動、記憶、感情、経験を生み出す、信じられないほど複雑な構造です。進化は人類に強力なツールを与え、私たちはそれを人工思考で再現しようとしています。それはニューラル ネットワークと呼ばれる驚異的な技術です。 |
<<: 人工知能やブロックチェーンはビッグデータの範疇に入るのでしょうか?
>>: アルゴリズムの微積分: 面接で目立つための関数微分公式 5 つ
1950年代にチューリングの論文「ロボットは考えることができるか?」が人工知能への扉を開いて以来、人...
我が国は鉱物資源が豊富な国であり、石炭、金属、その他の鉱物の生産地が非常に多く、我が国の鉱業開発は常...
古代から現代に至るまで、自然災害は人類に限りない損失をもたらしてきました。都市社会がますます発展する...
[[318810]]ビッグデータダイジェスト制作出典: rutgers.edu編纂者:張大毓如、夏亜...
3か月前、OpenAIのGPT-4がデビューし、注目を集めました。そのマルチモーダル機能は人類に衝撃...
翻訳者 |陳俊レビュー | Chonglouこの記事では、「少量学習」の概念を紹介し、テキスト分類で...
人工知能は21世紀における最も重要な技術的成果となりました。したがって、世界規模の開発動向に注目する...
最近、友人とこの問題について話し合っています。ご存知のとおり、IT 業界は標準的な「若者の仕事」です...
論文リンク: https://arxiv.org/pdf/2306.02207.pdfデモページ: ...
2022年のゲーデル賞が発表されました! ACM アルゴリズムおよび計算理論に関する興味グループ (...
執筆者 | Yan Zheng 「スピンオフ」によりアリババは再生し、ビッグモデルによりアリババクラ...
人工知能は大きなビジネス価値をもたらすことができます。しかし、AI のメリットを最大限に引き出すには...
私たちの日常生活では、携帯電話のさまざまなアプリにますます依存するようになっています。外食時にレスト...