AI、機械学習、ディープラーニングのつながりと違いを1つの記事で理解する

AI、機械学習、ディープラーニングのつながりと違いを1つの記事で理解する

急速に変化する今日のテクノロジーの世界では、人工知能 (AI)、機械学習 (ML)、ディープラーニング (DL) は、情報技術の新たな波をリードする輝く星のような存在です。これら 3 つの単語は、さまざまな最先端の議論や実際の応用で頻繁に登場しますが、この分野に不慣れな多くの研究者にとって、その具体的な意味と本質的なつながりは、いまだに謎に包まれているかもしれません。

それではまずこの写真を見てみましょう。

このことから、ディープラーニング、機械学習、人工知能の間には密接かつ進歩的なつながりがあることがわかります。「ディープラーニング」は「機械学習」の一分野であり、「機械学習」は「人工知能」の一分野です。

人工知能とは何ですか?

人工知能 (AI) は一般的で幅広い概念です。その究極の目標は、人間の知能をシミュレートし、拡張し、さらにはそれを超えることができるコンピューティング システムを構築することです。具体的な用途としては、次のものがあります。

  • 画像認識は AI の重要な分野です。コンピューターが視覚センサーを通じてデータを取得し、そのデータを分析して画像内の物体、シーン、動作、その他の情報を識別し、人間の目と脳による視覚信号の認識と理解をシミュレートする方法を研究しています。
  • 自然言語処理 (NLP) とは、コンピューターが自然な人間の言語を理解し、生成する能力です。テキスト分類、意味解析、機械翻訳などのさまざまなタスクをカバーし、聞く、話す、読む、書くといった人間の知的行動をシミュレートしようとします。
  • コンピュータ ビジョン (CV) には、より広い意味では画像認識が含まれます。また、画像分析、ビデオ分析、3D 再構築などの側面も含まれます。その目的は、人間の視覚システムを忠実に模倣し、コンピュータが 2D または 3D 画像から世界を「見て」理解できるようにすることです。
  • ナレッジ グラフ (KG) は、エンティティとその複雑な関係を保存および表現するために使用される構造化データ モデルです。認知プロセスで知識を蓄積して活用する人間の能力、および既存の知識に基づいた推論と学習のプロセスをシミュレートします。

これらの一見ハイエンドな技術は、実際には「人間の知能をシミュレートする」という中核概念を中心に据えており、視覚、聴覚、思考ロジックなどのさまざまな知覚次元に特化した研究とアプリケーション開発のみを実施し、人工知能技術の発展と進歩を促進しています。

機械学習とは何ですか?

機械学習 (ML) は AI の重要な分野です。コンピューター システムが何らかのアルゴリズムに基づいてデータからルールやパターンを自動的に「学習」し、それに基づいて予測や決定を下せるようにすることで、人間の知能をシミュレート、拡張、拡大します。

たとえば、猫の認識モデルをトレーニングする場合、機械学習のプロセスは次のようになります。

  • データ前処理: まず、収集された大量の猫と猫以外の画像が、スケーリング、グレースケール、正規化などの操作を含む前処理が行われ、画像が特徴ベクトル表現に変換されます。これらの特徴は、Haar のような特徴、ローカル バイナリ パターン (LBP)、またはコンピューター ビジョンの分野で一般的に使用されるその他の特徴記述子など、手動で設計された特徴抽出手法から取得される場合があります。
  • 特徴選択と次元削減: 問題の特性に基づいて主要な特徴を選択し、冗長で無関係な情報を削除し、場合によっては PCA や LDA などの次元削減手法を使用して特徴の次元をさらに削減し、アルゴリズムの効率を向上させます。
  • モデルのトレーニング: 次に、前処理されたラベル付きデータセットを使用して、選択した機械学習モデルをトレーニングします。モデル パラメータを調整することでモデルのパフォーマンスが最適化され、モデルは特徴に基づいて猫の画像と猫以外の画像を区別できるようになります。
  • モデルの評価と検証: トレーニング後、モデルは独立したテスト セットを使用して評価され、モデルの一般化能力が優れており、これまでに見たことのない新しいサンプルに正確に適用できることを確認します。

最も一般的に使用される機械学習アルゴリズムのトップ 10 は、決定木、ランダム フォレスト、ロジスティック回帰、SVM、ナイーブ ベイズ、K 最近傍アルゴリズム、K 平均アルゴリズム、Adaboost アルゴリズム、ニューラル ネットワーク、マルコフなどです。

ディープラーニングとは何ですか?

ディープラーニング (DL) は、機械学習の特殊な形式です。主にディープニューラルネットワーク構造を利用して、人間の脳が情報を処理する方法をシミュレートし、データから複雑な特徴表現を自動的に抽出します。

たとえば、猫の認識モデルをトレーニングする場合、ディープラーニングのプロセスは次のように進行します。

(1)データの前処理と準備:

  • 猫の画像と猫以外の画像の大規模なデータセットを収集し、それらを整理して注釈を付け、各画像に対応するラベル (「猫」や「猫以外」など) が付いていることを確認します。
  • 画像の前処理: すべての画像を均一なサイズに変更し、正規化、データ拡張、その他の操作を実行します。

(2)模型の設計と構築:

  • ディープラーニング アーキテクチャを選択します。画像認識タスクでは、通常、畳み込みニューラル ネットワーク (CNN) が使用されます。 CNN は、画像のローカルな特徴を効果的に抽出し、それを多層構造を通じて抽象的に表現することができます。
  • 畳み込み層 (特徴抽出用)、プーリング層 (計算量を削減し、過剰適合を防ぐため)、完全接続層 (特徴を統合および分類するため)、および可能なバッチ正規化層と活性化関数 (ReLU、シグモイドなど) を含むモデル階層を構築します。

(3)パラメータを初期化し、ハイパーパラメータを設定する。

  • ランダム初期化または特定の初期化戦略によって、モデル内の各レイヤーの重みとバイアスを初期化します。
  • 学習率、オプティマイザー(SGD、Adam など)、バッチ サイズ、トレーニング サイクル(エポック)などのハイパーパラメータを設定します。

(4)前方伝播:

  • 前処理された画像がモデルに入力され、各層での畳み込み、プーリング、線形変換などの操作を経て、最終的に出力層の予測確率分布、つまりモデルが入力画像を猫であると判断する確率が得られます。

(5)損失関数とバックプロパゲーション:

  • クロスエントロピー損失関数またはその他の適切な損失関数を使用して、モデル予測結果と実際のラベルの差を測定します。
  • 損失を計算した後、バックプロパゲーション アルゴリズムが実行され、モデル パラメータに対する損失の勾配が計算され、パラメータが更新されます。

(6)最適化とパラメータ更新:

  • 勾配降下法またはその他の最適化アルゴリズムは、損失関数を最小化するために勾配情報に基づいてモデル パラメータを調整するために使用されます。
  • 各トレーニングの反復中に、モデルはパラメータを学習および調整し続け、猫の画像を認識する能力が徐々に向上します。

(7)検証と評価:

  • 検証セットでモデルのパフォーマンスを定期的に評価し、精度、精度、再現率などの指標の変化を監視して、モデルのトレーニング中にハイパーパラメータの調整と早期停止戦略を導きます。

(8)研修の修了とテスト:

  • 検証セットでのモデルのパフォーマンスが安定するか、事前に設定された停止条件に達したら、トレーニングを停止します。
  • 最後に、モデルの一般化能力が独立したテスト セットで評価され、モデルがこれまで見たことのない新しいサンプル上の猫を効果的に識別できるかどうかが確認されます。

ディープラーニングと機械学習の違い

ディープラーニングと機械学習の違いは次のとおりです。

1. 問題解決の方法

機械学習アルゴリズムは通常、手動で設計された特徴エンジニアリングに依存しています。つまり、問題の背景知識に基づいて主要な特徴を事前に抽出し、それらの特徴に基づいてモデルを構築してソリューションを最適化します。

ディープラーニングはエンドツーエンドの学習アプローチを採用し、複数の非線形変換層を通じて高レベルの抽象的な特徴を自動的に生成します。これらの特徴は、手動で特徴を選択および構築する必要がなく、トレーニングプロセス全体を通じて継続的に最適化され、人間の脳の認知処理方法に近いものになります。

例えば、車を識別するソフトウェアを作成したい場合、機械学習を使用する場合は、サイズや形状などの車の特徴を手動で抽出する必要があります。ディープラーニングを使用する場合は、人工知能ニューラルネットワークがこれらの特徴を自動的に抽出しますが、学習するには車としてマークされた大量の写真が必要です。

2. 適用シナリオ

指紋認識や特徴物体検出などの分野における機械学習の応用は、基本的に商用化の要件を満たしています。

ディープラーニングは主に、テキスト認識、顔認識技術、意味分析、インテリジェント監視などの分野で使用されます。現在では、スマートハードウェア、教育、医療などの業界にも急速に進出しています。

3. 必要なデータ量

機械学習アルゴリズムは、サンプル数が少ない場合でも優れたパフォーマンスを発揮します。特徴を簡単に抽出できる単純なタスクや問題の場合、少ないデータでも満足のいく結果が得られます。

ディープラーニングでは通常、ディープニューラルネットワークをトレーニングするために大量のラベル付きデータが必要です。その利点は、生データから複雑なパターンや表現を直接学習できることです。特にデータ規模が大きくなると、ディープラーニングモデルのパフォーマンス向上がより顕著になります。

4. 実行時間

トレーニング段階では、ディープラーニング モデルにはより多くのレイヤーと多数のパラメーターがあるため、トレーニング プロセスに時間がかかることが多く、GPU クラスターなどの高性能コンピューティング リソースのサポートが必要になります。

対照的に、機械学習アルゴリズム(特に軽量モデル)は通常、トレーニング時間とコンピューティングリソースが少なくて済むため、迅速な反復と実験検証に適しています。

<<: 

>>:  Appleは自動車製造を諦めてAIに目を向けたが、Li Xiang氏はこう答えた。「その通りだ!」その背後にある真実は人々に深く考えさせる

ブログ    
ブログ    

推薦する

ディープラーニングのメリットが終わりを迎える中、AIは再び「死の谷」に直面しているのでしょうか?

[[384224]]大いに期待されているディープラーニングは、人工知能を再び AI の冬に突入させ...

...

Windows Update で使用される指数アルゴリズムにより、XP マシンの速度が大幅に低下する

[[92385]] Windows XP ユーザーは、現在の XP が 2001 年にリリースされた...

AIと胚の融合?システム生物学者のパトリック・ミュラーは双子ネットワークを使ってゼブラフィッシュの胚を研究している

動物の発育過程において、胚は時間の経過とともに複雑な形態変化を遂げます。研究者は、発育の時間と速度を...

TFserving によるディープラーニング モデルの導入

1. TFservingとは何かモデルをトレーニングし、それを外部の関係者に提供する必要がある場合は...

人工知能はチェスをプレイする以外に何をすべきでしょうか?

[[183486]]医療、金融、交通、教育、公安、小売、商業サービスなどの業界は、電子データの度合...

ビジネスオートメーション、斗山の市場成功の鍵

ますます激化する競争の中で、どのように効率的に生産するかと問われれば、答えは自動化の助けを借りること...

...

2018 年後半のディープラーニング プロジェクトをお見逃しなく!

[[252582]]ビッグデータダイジェスト制作翻訳者:fuma、Ni Ni、Jiang Baos...

...

機械学習の発展が吹き替え技術の向上にどのように役立つか

翻訳者 | 李睿校正 | 梁哲、孫淑娟人工知能 (AI) テクノロジーはここ数年で急速に発展し、ビジ...

...

AI専門家が警告:GPT-3は素晴らしいが透明性に欠ける

[[342733]]アルゴリズムに人間のように書かせることは、人工知能研究機関 OpenAI が長年...

AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

はい、この時計があれば、MNIST 手書きデータセットなしでは生きていけません。私たちは古代の真空管...