ディープラーニングと機械学習の違いを理解する

機械学習とディープラーニングの違いは何だろうとよく疑問に思う方は、この記事を読んで、その違いを一般の人にもわかる言葉で説明してください。

機械学習とディープラーニングはますます人気が高まっています。突然、誰もが、知っていたかどうかに関わらず、機械学習とディープラーニングについて話すようになりました。データサイエンスに積極的に注目しているかどうかにかかわらず、おそらくこれらの 2 つの用語を聞いたことがあるでしょう。

どれほど人気があるのかを示すために、Google トレンドで次のキーワードを検索しました。

機械学習とディープラーニングの違いを自分なりに明確にしたい場合は、この記事を読んでください。わかりやすい言葉でその違いを紹介します。機械学習とディープラーニングで使われる用語について詳しく説明します。さらに、それらの違いを比較し、それぞれの使用シナリオについて説明しました。

機械学習とディープラーニングとは何ですか?

まずは基本から始めましょう。機械学習とディープラーニングとは何でしょうか? すでにご存知の場合は、このセクションを飛ばしてください。

機械学習とは何ですか?

一言で言えば、広く引用されているトム・ミッチェルによる機械学習の定義が最も適切な説明を与えています。内容は次のとおりです:

「コンピュータプログラムは、ある種のタスク T とパフォーマンス測定基準 P が与えられた場合、経験 E から学習できます。タスク T でのパフォーマンスが P で測定できる場合、経験 E によってパフォーマンスが向上します。」

わかりにくいですか? 簡単な例を使ってこの説明を分解してみましょう。

例 1: 機械学習と身長に基づく体重の推定

身長に基づいて人の体重を推定できるシステムを作成したいとします (おそらく、何らかの理由でこれに興味があるのでしょう)。次に、機械学習を使用して、データキャプチャにおける可能性のあるエラーや間違いを見つけることができます。まず、データを収集する必要があります。データがどのようなものかを見てみましょう。

グラフの各ポイントはデータポイントに対応しています。単純な対角線を描くことで、身長に基づいて体重を予測できます。

たとえば、このスラッシュ:

体重（ kg ）＝身長（ cm ）-100

...これらの傾斜は予測に役立ちます。これらの傾斜は素晴らしいものですが、その仕組みを理解する必要があります。予測と実際の間の誤差を減らし、パフォーマンスを測定する必要があります。

もっと広い意味では、収集するデータ（経験）が多ければ多いほど、モデルはより良くなります。さらに変数（性別など）を追加したり、異なる予測子の傾きを追加したりすることで、モデルを改良することもできます。

例2: ハリケーン予測システム

もっと複雑な例を見てみましょう。ハリケーン予測システムを構築したいとします。過去のすべてのハリケーンに関するデータと、このハリケーン以前の 3 か月間の気象情報があるとします。

ハリケーン予測システムを手動で構築するとしたら、どのようにすればよいでしょうか?

まず第一に、私たちの仕事は、すべてのデータをクリーニングしてデータ内のパターンを見つけ、次にハリケーンの形成条件を見つけることです。

モデル条件データ (温度 40 度以上、湿度 80 ～ 100 など) をシステムに入力して出力を生成することも、これらの条件データを使用してシステムに適切な出力を生成させることもできます。

過去のデータをすべてシステムに入力すれば、将来ハリケーンが発生するかどうかを予測できます。システム条件の値に基づいて、システムのパフォーマンス（システムが正しく予測したハリケーンの数）を評価します。システムの予測結果をフィードバックとして使用して、上記の手順を複数回繰り返し続けることができます。

これまでの説明に基づいて予測システムを定義してみましょう。私たちの仕事は、ハリケーンを発生させる可能性のある気象条件を判断することです。パフォーマンス P は、与えられたすべての条件を前提としてシステムがハリケーンを正しく予測した回数です。経験 E はシステムの反復回数です。

ディープラーニングとは何ですか?

ディープラーニングの概念は新しいものではありません。それは数年前から存在しています。しかし、世の中にはさまざまな誇大宣伝があり、ディープラーニングはますます注目を集めています。機械学習の場合と同様に、まずディープラーニングの公式定義を見てから、例を挙げて説明しましょう。

「ディープラーニングは、世界を概念のネストされた階層として表現することを学習することで、非常に大きなパワーと柔軟性を実現する特別な種類の機械学習です。各概念はより単純な概念との関連性に基づいて定義され、より抽象的な表現はより抽象度の低い概念に基づいて計算されます。」

これも少し混乱します。簡単な例を使ってこの概念を分解してみましょう。

例1: 形状検出

概念レベルで何が起こっているかを説明するために、簡単な例から始めましょう。正方形を他の図形と区別する方法を見てみましょう。

最初に確認するのは、グラフに 4 本の線があるかどうかです (単純な概念)。このような 4 本の線が見つかった場合は、それらが互いに接続され、閉じていて、垂直であり、等しいことをさらに確認します (ネストされた概念階層)。

そこで、私たちは複雑なタスク（正方形を認識する）を、より単純で抽象度の低いタスクの形で完了させました。ディープラーニングは本質的に、同様のロジックを大規模に実行します。

例2: 猫と犬

動物認識の例を見てみましょう。この例では、システムは、与えられた画像内の動物が猫か犬かを識別する必要があります。

機械学習とディープラーニングの比較

機械学習とディープラーニングについて理解できたので、いくつかの重要なポイントを学び、2 つのテクノロジーを比較してみましょう。

データ依存性

ディープラーニングと従来の機械学習の主な違いは、データのサイズが大きくなるにつれてパフォーマンスが向上することです。ディープラーニングアルゴリズムは、データが少ない場合にはうまく機能しません。これは、ディープラーニングアルゴリズムを完全に理解するには大量のデータが必要になるためです。一方、この場合、従来の機械学習アルゴリズムは定式化されたルールを使用し、より優れたパフォーマンスを発揮します。次の図はこの事実をまとめたものです。

ハードウェア依存性

ディープラーニングアルゴリズムには、多数の行列演算が必要です。GPU は主に行列演算を効率的に最適化するために使用されるため、ディープラーニングが適切に機能するためには GPU が不可欠なハードウェアです。従来の機械学習アルゴリズムと比較すると、ディープラーニングは GPU を搭載したハイエンドマシンに大きく依存します。

特徴処理

特徴処理とは、ドメイン知識を特徴抽出器に組み込んでデータの複雑さを軽減し、学習アルゴリズムを機能させるより優れたパターンを生成するプロセスです。機能処理プロセスには時間がかかり、専門知識が必要です。

機械学習では、ほとんどのアプリケーションの機能は専門家によって決定され、データ型としてエンコードされる必要があります。

特徴としては、ピクセル値、形状、テクスチャ、位置、方向などがあります。ほとんどの機械学習アルゴリズムのパフォーマンスは、抽出された特徴の精度に依存します。

ディープラーニングはデータから直接高レベルの特徴を取得しようとします。これがディープラーニングと従来の機械学習アルゴリズムの主な違いです。これに基づいて、ディープラーニングは各問題に対する特徴抽出器を設計する作業を削減します。たとえば、畳み込みニューラルネットワークは、初期の層で低レベルの特徴 (境界、線) を学習し、次に顔の各部分を学習し、最後に顔の高レベルの説明を学習しようとします。詳細については、「ディープラーニングにおけるニューラルネットワーク機械学習の興味深いアプリケーション」をお読みください。

問題解決方法

従来の機械学習アルゴリズムを問題の解決に適用する場合、従来の機械学習では通常、問題を複数のサブ問題に分割して 1 つずつ解決し、すべてのサブ問題の結果を組み合わせて最終結果を取得します。対照的に、ディープラーニングはエンドツーエンドの直接的な問題解決を提唱しています。

例えば：

画像内のオブジェクトの種類と、画像内の各オブジェクトの位置を必要とする複数オブジェクト検出タスクがあるとします。

従来の機械学習では、問題をオブジェクト検出とオブジェクト認識の 2 つのステップに分割します。まず、境界ボックス検出アルゴリズムを使用して画像全体をスキャンし、オブジェクトである可能性のある領域を見つけます。次に、オブジェクト認識アルゴリズム (HOG と組み合わせた SVM など) を使用して、前の手順で検出されたオブジェクトを識別します。

対照的に、ディープラーニングは入力データを直接操作して出力結果を取得します。たとえば、画像を YOLO ネットワーク (ディープラーニングアルゴリズム) に直接渡すと、YOLO ネットワークが画像内のオブジェクトと名前を付与します。

実行時間

通常、ディープラーニングアルゴリズムのトレーニングには長い時間がかかります。これは、ディープラーニングアルゴリズムには多くのパラメーターがあるため、アルゴリズムのトレーニングに時間がかかるためです。最も高度なディープラーニングアルゴリズム ResNet を完全にトレーニングするには 2 週間かかりますが、機械学習のトレーニングには比較的短い時間、数秒から数時間しかかかりません。

しかし、2つのテストのタイミングは完全に逆です。ディープラーニングアルゴリズムは、テスト時に実行するのに非常に短い時間しかかかりません。 k近傍法（機械学習アルゴリズム）と比較すると、データ量が増えるにつれてテスト時間も長くなります。ただし、これはすべての機械学習アルゴリズムに当てはまるわけではなく、一部の機械学習アルゴリズムではテスト時間が短いものもあります。

説明可能性

重要なのは、機械学習とディープラーニングを比較する際の要素として解釈可能性を考慮することです。

例を見てみましょう。ディープラーニングを適用して記事を自動的に評価するとします。ディープラーニングは人間に近いパフォーマンスを実現できるので、非常に驚異的です。しかし、まだ問題が残っています。ディープラーニングアルゴリズムでは、なぜそのスコアが付けられたのかはわかりません。もちろん、数学的には、どのディープニューラルネットワークノードがアクティブ化されているかを調べることができます。しかし、ニューロンのモデルがどうあるべきか、また、これらのニューロンユニットの層が集合的に何をすべきかはわかっていません。したがって、結果がどのように生成されたかを説明することは不可能です。

一方、決定木などの機械学習アルゴリズムは、アルゴリズムがなぜその選択を行ったのかを説明する明確なルールを提供するため、決定の背後にある理由を説明するのは簡単です。したがって、業界では解釈可能性のために、決定木や線形/ロジスティック回帰などのアルゴリズムが主に使用されています。

<<: 分析: 機械学習を妨げる 10 のサイバー攻撃とは?

>>: 2017 年に最も価値のある機械学習のスキルや知識は何ですか?

ブログ

ディープラーニングと機械学習の違いを理解する

画像内の文字の教師なし学習

ビッグデータと人工知能のデュアルエンジンが企業のデジタル変革を推進

スマートビルと建築技術の未来

Go言語で遺伝的アルゴリズムを実装する方法

2021 年のファッションラグジュアリーの美的パラダイムとは何でしょうか?答え: テクノロジー

100 以上の自然言語処理データセットが無料で、データの検索に困ることはありません。

推薦する

AI の専門家に転身した男性の感動的なストーリー。素人から Alibaba Cloud で最優秀賞を獲得するまで、彼が経験した落とし穴は 100 日間で学ぶには十分です。

弁護士は直感に基づいて仕事をするのでしょうか? AIはそうは思わない

Java プログラミングスキル - データ構造とアルゴリズム「ツリー」

ロボティックプロセスオートメーションが人々の働き方をどのように変えているのか

GoogleはAIチップに出産を学習させ、次世代のTPUはAI自身によって設計される

ディープラーニングがインターネットにパーソナライゼーションをもたらす仕組み

AirPodsは「あなたの脳を読む」ことができるのか？あるいは汗中の乳酸濃度も監視できるタイプ｜ネイチャー

大学入試の願書記入や学校選びの際、人工知能を専攻するならこれらの学校を選ばなければなりません！

RPA の利点と欠点は何ですか?

TensorFlowはディープラーニングに基づく画像補完を実装する

Baiduカスタマイズ画像オープンプラットフォームのトレーニングと評価

「顔の特徴による犯罪者の識別」という論文がNatureに掲載されるのでしょうか？ 1,700人の科学者が共同で反対