ディープラーニングを理解するには、より低い次元からアプローチするべきでしょうか、それともより高い次元で考えるべきでしょうか?

ディープラーニングを理解するには、より低い次元からアプローチするべきでしょうか、それともより高い次元で考えるべきでしょうか?

今日のトピックは、複数選択問題から始めましょう。

ニューラルネットワークとは何ですか?

次の説明のうち正しいものを 1 つ以上選択してください。

A. ニューラルネットワークは、入力を受け取って出力を生成する数学関数です。

B. ニューラル ネットワークは、多次元配列が流れる計算グラフです。

C. ニューラル ネットワークは複数の層で構成され、各層には「ニューロン」があります。

D. ニューラルネットワークは汎用的な関数近似器です。

あなたの答えは ________ です。

答えを発表します。正解は… ABCDです。

ちょっと混乱していますか?ニューラルネットワークの単一の統一された説明は存在しないのでしょうか?

セス・ワイドマン元Facebookのデータサイエンティストです。彼は、さまざまな業界の人々にデータサイエンスと機械学習を教えるために世界中を旅するよう招待されています。

[[390479]]

セス・ワイドマン、元Facebookデータサイエンティスト 出典: sethweidman.com

著書『Getting Started with Deep Learning in Python: Building CNNs and RNNs from Scratch』の中で、Weidman 氏は次のように書いています。

ニューラル ネットワークを説明する上で最も難しいのは、ニューラル ネットワークとは何かについての正しいメンタル モデルを伝えることです。これは主に、ニューラル ネットワークを理解するには 1 つのメンタル モデルではなく複数のメンタル モデルが必要であり、それぞれのメンタル モデルがニューラル ネットワークの動作の異なる (そしてそれぞれが重要な) 側面を説明するためです。

確かに、ニューラル ネットワークとディープラーニングは 3 次元の分野です。数学的レベルまたはコード レベルのみで学習すると、必然的に一般化に陥り、包括的な理解が得られなくなります。このため、ワイドマン氏は、ディープラーニング分野の全体像を把握するために、数学、概略図、Python コードの 3 つの次元で各概念を理解するという新しい学習方法を提案しました。

独自のディープラーニングの建物を構築したいと想像してください。アルゴリズムが好きだったり、視覚的な学習に慣れていたりしても、 「高次元で考える」ことによってのみ、多用途で精巧な建物を建てることができます。

ワイドマンは、導関数、ネストされた関数、連鎖などの概念を学習するための次の手順を提案しました。これらの基本概念はレンガのようなもので、これらを使用して、最終的には独自のディープラーニング ビルディングを構築します。

  • 1 つ以上の方程式を使用して数学の原理を説明します。
  • コーディング面接中にホワイトボードに描くような図表を用意します。
  • 対応する Python コードを指定します。

この学習方法を使用して、微分の概念をどのように理解できるかを見てみましょう。

微分はディープラーニングにおいて非常に重要な概念です。一般に、ある点における関数の導関数は、その点における入力に対する関数の出力の「変化率」として単純に考えることができます。

次元 1: 数学

まず、微分を数学的な次元で定義します。特定の入力値を変更したときに関数の出力がどの程度変化するかという制限を数値で表すことができます。

この制限は、Δ に非常に小さい値 (例: 0.001) を設定することによって数値的に近似できます。したがって、Δ = 0.001 の場合、導関数は次のように計算できます。

これは近似値ではありますが、完全な派生メンタルモデルの一部にすぎません。導関数を模式図の観点から理解してみましょう。

次元2: 概略図

関数曲線の接線を描くと、点 a における関数 f の導関数は点 a における線の傾きになります。この線の傾きは 2 つの方法で計算できます。最初の方法は、微積分を使用して実際に極限を計算することです。2 番目の方法は、下の図に示すように、直線 f の傾きを a−0.001 と a+0.001 で取得することです。

これを視覚化する別の方法は、関数を小さな工場として考え、その入力がワイヤで出力に接続されていると考えることです。導関数を解くことは、次の質問に答えることと同じです。関数の入力 a を少し上げると、工場の内部動作メカニズムに従って、出力はこの小さな値の何倍に変化しますか?

ディープラーニングを理解するには、2 番目の表現の方が 1 番目の表現よりも重要です。

次元3: Pythonコード

先ほど見た導関数の近似値は、次のようにコーディングすることで解くことができます。

P が E (ランダムに選択された文字) の関数であると言うとき、実際に意味するのは、f (E ) =P となる関数 f が存在するということです。つまり、オブジェクト E を受け取ってオブジェクト P を生成する関数 f が存在します。言い換えれば、P は関数 f を E に適用したときに生成される任意の関数値です。

以下のようにエンコードできます。

<<:  TransformerはCNNを超え、計算複雑性の問題を解決します

>>:  ビッグデータと人工知能を活用して英語教育の問題を解決する

ブログ    
ブログ    
ブログ    

推薦する

金融ロボットの解読:毒ではなくアシスタント

[[231414]]会計、税務、監査などの業務でロボットが人間に取って代わったらどうなるか想像してみ...

NvidiaはAIを使用してGPU演算回路を設計します。これは最先端のEDAよりも25%小さく、より高速で効率的です。

膨大な数の演算回路を搭載した NVIDIA GPU により、AI、高性能コンピューティング、コンピュ...

サイバー攻撃が自動運転車に勝てない理由

マルウェア、ランサムウェア、ウイルス、サービス拒否攻撃など、これらの脅威は回復が困難なため、企業を窮...

2020 年の AI トレンド トップ 10

デジタル労働力をサポートし維持するために職場で AI が普及することは、2020 年の明確なトレンド...

衝突の火花: ディープ AI とワイヤレス センシング (パート 1)

[[435758]]序文モノのインターネット (IoT) の発展により、さまざまな無線信号 (Wi...

このAIアルゴリズムの面接体験は非常に役立つ:Amazonは履歴書から面接まで実践的な経験を共有

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

北京冬季オリンピックのブラックテクノロジーが外国人に賞賛される:このロボットがある限り、防疫は安全

昨日、北京冬季オリンピックはブラックテクノロジーでいっぱいだとネットユーザーが言っているのを見ました...

GPT-4Vと人間のデモンストレーションによるロボットのトレーニング:目が学習し、手がそれに従う

言語/視覚入力をロボットの動作に変換するにはどうすればよいでしょうか?カスタムモデルをトレーニングす...

...

国内人材レポート:機械学習エンジニアの平均給与は3万元近くで、トップクラスのエンジニアは年間100万元を稼ぐこともできる

最近、BOSS直接採用キャリア科学実験室とBOSS直接採用研究所は、毎年恒例の大ヒット作「変異の時代...

イタリアの規制当局はChatGPTがEUのプライバシー法に違反していると主張

海外メディアの報道によると、1月31日、イタリアの規制当局は、OpenAIの人工知能チャットボット「...

OpenAI の Whisper モデルを使用して音声をテキストに変換する

翻訳者 |ブガッティレビュー | Chonglou図1. OpenAI Whisperモデルの動作原...

PS 2021 では、さまざまな新しい AI テクノロジーが導入されます。 Meitu Xiuxiuよりも使いやすい

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

中国初!最も人気のあるMoE大型モデルアプリがここにあります。無料でダウンロードでき、誰でもプレイできます。

MoE(Mixed of Experts)モデルは最近とても人気があるので、詳しく紹介する必要はな...

...