機械学習とディープラーニングとは何ですか?ファイザン・シャイクがお手伝いします

機械学習とディープラーニングとは何ですか?ファイザン・シャイクがお手伝いします

概要: この記事では、機械学習とディープラーニングの定義と応用についてわかりやすい言葉で紹介するとともに、ソースデータ要件、ハードウェアサポート、特徴エンジニアリング、問題解決方法、実行時間、解釈可能性などの違いについても紹介します。これは初心者にとって大きな啓発的意義があります。

ウェッジ:

機械学習とディープラーニングは現在注目されており、突然多くの人がそれについて話していることがわかります。下図は機械学習とディープラーニングのトレンド比較です(Google トレンドより、縦軸は検索人気度を表しています)。

この記事では、シンプルでわかりやすい言葉と例を使って、ディープラーニングと機械学習の違いを詳しく説明し、関連する用途を紹介します。

機械学習とディープラーニング入門

機械学習

トム・ミッチェルによる広く引用されている機械学習の定義は次のとおりです。

ある種のタスク T とパフォーマンス メトリック P について、P によって測定される T でのパフォーマンスが経験 E によって向上する場合、コンピュータ プログラムは経験 E から学習していると言われます。

「コンピュータプログラムは、タスクTとパフォーマンス測定Pに関して経験Eから学習するとは、Pで測定されるTのタスクのパフォーマンスが経験Eとともに向上する場合である。」

上記の抽象的な定義は混乱を招くかもしれませんが、次の簡単な例を見れば明らかになると思います。

[例1 身長から体重を予測する]

身長に基づいて人の体重を予測するシステムを作成したいとします。最初のステップは、データの収集です。データを収集したら、下図のようにデータ分布グラフを描きます。図の各点はデータを表し、水平軸は身長、垂直軸は体重を表します。

たとえば、身長から体重を予測するために単純な直線を描くことができます。

体重(kg)=身長(cm)-100

この線が身長を正確に予測できるとしたら、そのパフォーマンスをどのように測定するのでしょうか?たとえば、予測モデルのパフォーマンスは、予測値と実際の値の差によって測定されます。もちろん、ソース データが多ければ多いほど、モデルは良くなります。効果が良くない場合は、変数(性別など)を追加したり、予測ラインを変更したりするなど、他の方法を使用してモデルのパフォーマンスを向上させることができます。

【事例2 暴風雨予測システム】

嵐の予測システムを構築したいと考えており、過去の嵐のデータとその嵐の 3 か月前の気象データがあるとします。では、嵐予測システムはどのように構築するのでしょうか?

最初に行うべきことは、データをクリーンアップし、嵐の形成につながる条件など、データ内の隠れたパターンを見つけることです。温度が 40 度以上かどうか、湿度が 80 から 100 の間かどうかなどの条件をモデル化し、これらの特徴をモデルに入力することができます。

必要なのは、過去のデータを最大限に活用し、嵐が発生するかどうかを予測することだけです。この例では、メトリックは正しく予測された嵐の数です。予測プロセスを複数回繰り返し、パフォーマンス結果をシステムに報告することができます。

機械学習の本来の定義に戻ると、嵐予測システムを次のように定義します。タスク T は嵐を引き起こす大気条件を見つけること、パフォーマンス P はモデルパラメータを学習した後の正しい予測の数、経験 E はシステムの反復プロセスです。

ディープラーニング

ディープラーニングは実は随分前に登場したのですが、近年の盛り上がりにより、徐々に再び人気が出てきています。

ディープラーニングは、現実世界を概念のネストされた階層システムとして表現する特殊なタイプの機械学習であり(複雑な概念は、一般的な抽象化から高レベルの抽象表現までのより単純な概念間の接続によって定義されます)、強力なパフォーマンスと柔軟性を実現します。

ディープラーニングは、世界を概念のネストされた階層として表現することを学習することで、大きなパワーと柔軟性を実現する特別な種類の機械学習です。各概念はより単純な概念との関係で定義され、より抽象的な表現はより抽象度の低い概念に基づいて計算されます。

【例1 グラフィックス検出】

長方形を他の図形と区別したいとします。人間の目はまず、その形状に 4 辺があるかどうかを検出します (単純な概念)。 4 つのエッジがある場合は、それらが接続され、閉じられ、垂直であり、等しいかどうかを確認します (ネストされた階層の概念)。実際、複雑なタスク (長方形の認識) をいくつかの単純で低レベルのタスクに分解します。ディープラーニングは本質的にこれをはるかに大規模な規模で実行します。

[例2 猫か犬]

このケーススタディでは、写真に写っている動物が猫なのか犬なのかを認識できるシステムの構築について説明します。

この問題を解決するために機械学習を使用する場合、動物にひげや耳があるかどうか、耳がある場合は耳が尖っているかどうかなど、いくつかの特徴を最初に定義する必要があります。簡単に言えば、顔の特徴を定義し、動物を分類する上でどの特徴が重要かをシステムに識別させたいと思っています。ディープラーニングはこれらのタスクを一度に完了できます。ディープラーニングは分類タスクに重要な特徴を自動的に見つけますが、機械学習は手動で指定する必要があります。

ディープラーニングのワークフローは次のとおりです。

1. まず、画像内で猫または犬に最も関連のある境界を見つけます。

2. 次に、ひげや耳を見つけられるかどうかなど、形と境界の組み合わせを見つけます。

3. 複雑な概念を継続的に階層的に認識することで、猫と犬を識別する上で重要な特徴を判断できるようになります。

機械学習とディープラーニングの比較

データ依存性

ディープラーニングと従来の機械学習の最も重要な違いは、データ量に応じてパフォーマンスが向上することです。ディープラーニング アルゴリズムは、そこに含まれるパターンを理解するために大量のデータを必要とするため、データが少ないとうまく機能しません。この場合、手動で指定されたルールを使用する従来の機械学習が優先されます。次の図に示すように:

ハードウェアサポート

ディープラーニング アルゴリズムはハイエンド マシンに大きく依存しますが、従来の機械学習はローエンド マシンでも実行できます。ディープラーニングでは多数の行列乗算演算が必要であり、GPU はこれらの演算を効果的に最適化できるため、GPU はディープラーニングに欠かせない要素となります。

機能エンジニアリング

特徴エンジニアリングは、ドメイン知識を特徴抽出器に供給し、データの複雑さを軽減し、データ内のパターンを学習アルゴリズムにとってより明白にすることで、より良い結果をもたらします。このプロセスは、時間と専門知識の点で非常にコストがかかります。機械学習では、使用される特徴のほとんどは専門家によって指定されるか、データドメインやデータタイプごとに事前の知識に基づいて決定されます。たとえば、特徴としては、ピクセル値、形状、テクスチャ、位置、方向などがあります。ほとんどの機械学習手法のパフォーマンスは、これらの特徴を識別して抽出する精度に依存します。

ディープラーニング アルゴリズムは、データから高レベルの特徴を学習しようとします。これがディープラーニングの独自性の一部であり、従来の機械学習を超える重要なステップです。ディープラーニングでは、各問題が、下部のエッジや線などの低レベルの特徴、次に顔の部分の特徴、最後に顔の高レベルの特徴を学習する畳み込みニューラル ネットワークなどの新しい特徴抽出器の開発にまで縮小されます。

問題解決

従来の機械学習手法を使用して問題を解決する場合、全体を部分に分割し、個別に解決してから、結果を組み合わせて問題を解決するという戦略がよく採用されます。ディープラーニングは、トレーニングデータを入力して最終結果を直接出力するエンドツーエンドのモデルを提唱しており、ネットワークが主要な特徴を抽出する方法を学習できるようにします。

たとえば、ターゲット検出を実行する場合は、ターゲットのカテゴリを識別し、画像内での位置を指摘する必要があります。

一般的な機械学習手法では、この問題をターゲット検出とターゲット認識の 2 つのステップに分割します。まず、grabcut などの境界ボックス検出技術を使用して画像全体をスキャンし、考えられるすべてのオブジェクトを見つけ、HOG/SVM などのターゲット認識アルゴリズムを使用して関連するオブジェクトを識別します。

ディープラーニング手法は、この問題をエンドツーエンドで処理します。たとえば、YOLO ネットは畳み込みニューラル ネットワークを通じてターゲットを特定して識別できます。つまり、元の画像が畳み込みニューラルネットワークに入力され、画像内のターゲットの位置とカテゴリが直接出力されます。

実行時間

通常、ディープラーニングのトレーニングには長い時間がかかります。これは、ディープラーニングの多くのパラメータが通常よりもはるかに長いトレーニング時間を必要とするためです。 ResNet をゼロからトレーニングするには約 2 週間かかりますが、機械学習のトレーニングには数秒から数時間しかかかりません。テストに必要な時間はまったく逆で、ディープラーニング アルゴリズムの実行にはごくわずかな時間しかかかりません。ただし、KNN(K近傍法、機械学習アルゴリズム)と比較すると、テストデータの量が増えるにつれてテスト時間も長くなります。ただし、すべての機械学習アルゴリズムの実行に長い時間がかかるわけではなく、短いテスト時間しか必要としないアルゴリズムもあります。

説明可能性

ディープラーニングを使用して記事を自動的にスコアリングすると、パフォーマンスが非常に良くなり、人間によるスコアリングレベルに近くなることがわかります。しかし、なぜそのようなスコアが付けられたのかは説明されていません。操作中は、ディープ ニューラル ネットワークのどのノードがアクティブになっているかはわかりますが、これらのニューロンが何をモデリングしているか、各レイヤーが何を実行しているかはわからないため、結果を解釈することはできません。

一方、決定木などの機械学習アルゴリズムは、ルールに従って各ステップで選択を行う理由を明確に説明します。そのため、決定木や線形/ロジスティック回帰などのアルゴリズムは、その解釈性の良さから産業界で広く使用されています。

機械学習とディープラーニングの応用シナリオ

Wiki では機械学習のいくつかの応用分野を紹介しています:

1.コンピュータービジョン:ナンバープレート認識や顔認識など。

2.情報検索:検索エンジン、テキスト検索、画像検索など。

3.マーケティング:自動電子メールマーケティング、ターゲット識別。

4.医療診断:がん診断、異常検出

5.自然言語処理:意味解析、写真のタグ付け

6.オンライン広告

下の図は機械学習の応用分野をまとめたものです。一般的に、応用範囲は非常に広いです。

Google は、機械学習/ディープラーニングを活用する業界ではよく知られた企業です。下の図に示すように、Google はさまざまな製品にディープラーニングを適用しています。

インスタントテスト

機械学習とディープラーニングの違いを本当に理解しているかどうかを評価するために、ここで簡単なクイズに答えて送信してください。必要なのは、機械学習とディープラーニングの両方を使用して次の問題を解決し、どちらのアプローチが優れているかを判断することです。

[シナリオ 1] カメラで撮影した生データを入力として受け取り、ハンドルの方向と角度を予測する無人車両システムを開発するとします。

[シナリオ 2] ある人物の信用情報と経歴情報に基づいて、その人に融資が認められるかどうかを評価します。

【シナリオ3】ロシア語のテキストをインドの言語に翻訳するシステムを作成します。

今後の動向

前のセクションでは、機械学習とディープラーニングの違いについてまとめました。このセクションでは、2 つの将来の動向について説明します。

1. 産業界でデータサイエンスと機械学習を利用する傾向が高まっていることを考えると、生き残りたい企業にとってビジネスでの機械学習の活用はますます重要になります。同時に、より基礎的な知識を理解することも必要です。

2. ディープラーニングはますます多くの驚きをもたらし、それは今後も続くでしょう。ディープラーニングは、利用可能なテクノロジーの中で最も先進的かつ最高のテクノロジーの 1 つであることが証明されています。

3. ディープラーニングと機械学習の研究は継続しており、以前のように学術界に限定されていません。現在、機械学習とディープラーニングは産業界と学術界で爆発的に発展しています。そして、これまで以上に資金が投入されれば、人材開発における重要なポイントの一つとなる可能性が高い。

終わり

この記事では、ディープラーニングと機械学習を詳細に比較し、皆さんがさらに学習するきっかけになれば幸いです。機械学習ロードマップとディープラーニングロードマップを参照してください。

【著者について】

[[190897]]

データサイエンス愛好家の Faizan Shaikh 氏は、ディープラーニングと人工知能に夢中です。

上記は翻訳です

この記事は北京郵電大学の@爱可可-爱生活先生の推薦であり、Alibaba Cloud Yunqi Communityによって翻訳されました。
記事の元のタイトル: ディープラーニングと機械学習 – 知っておくべき重要な違い! 著者: Faizan Shaikh、翻訳者: Li Feng、レビュアー: Duan Zhicheng-Haitang

この記事は簡略化された翻訳です。より詳しい内容については原文をご確認ください。

オリジナルの英語テキストは添付ファイルとしてダウンロードできます:  比較...[【方向】].1493902277.pdf

<<:  Tensorflow はディープラーニングに基づいて画像補完をどのように実装するのでしょうか?

>>:  質問応答をより自然にする - コピーと検索メカニズムに基づく自然な回答生成システムの研究

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

専門家の視点:汎用人工知能の可能性

人工知能分野の発展に関するニュースを追う際の課題の 1 つは、「AI」という用語が、無関係な 2 つ...

人工知能の解釈については、この記事を読んでください

人工知能のより一般的な定義、そしてこの分野における初期の定義は、1956 年のダートマス会議で MI...

興味深いアルゴリズムを知っていますか?

[[428794]]この記事はWeChatの公開アカウント「WeDoctor Front-end ...

人工知能に置き換えられる可能性が最も高い職業トップ10。今年の転職ではこの罠に陥らないように!

[[220405]]今の時代、就職市場は戦場です。人工知能とロボットの発達は職場に衝撃を与えた。従...

並列コンピューティングの量子化モデルとディープラーニングエンジンへの応用

この世で唯一負けない武術はスピードだ。ディープラーニング モデルをより速くトレーニングする方法は、常...

人工知能が税務業界を変える7つの方法

[[313080]]政府は、医療、輸送、防衛、国家安全保障など、多くの分野で AI とロボット工学を...

ジェネレーティブ AI によるヘルスケアの変革: 新たなユースケースと将来の可能性

ヘルスケアとウェルネスのダイナミックな分野では、ANI と生成 AI の組み合わせによる革命が進行し...

...

...

絶対確実な協働ロボット

人間とロボットが協力して協働ロボットを作る[[321860]]協働ロボットは人間と対話し、協働するよ...

1分で10日間の世界の天気を予測します! Google DeepMindの新しいAI天気予報がScienceに掲載され、業界のSOTAを圧倒

1分以内に、10日間の高精度な世界天気予報が提供されます。 ChatGPT に続いて、別の AI モ...

完全なグラフが利用できない場合にグラフディープラーニングを使用するにはどうすればよいでしょうか?

多様体学習は、2000 年に有名な科学雑誌 Science で初めて提案されて以来、情報科学の分野に...

Baidu は革命を起こしました!

10月17日午前、百度世界2023大会に、百度創業者のロビン・リー氏が白いシ​​ャツを着て落ち着い...

「一歩ずつ考えよう」というマントラよりも効果的で、プロジェクトが改善されていることを示す

大規模言語モデル (LLM) は、適切なプロンプトがあれば、多くの自然言語処理タスクにとって強力なツ...

量子機械学習モデルを構築するための Google の新しいフレームワーク、TensorFlow Quantum を探索する

[[319936]] [51CTO.com クイック翻訳] 量子コンピューティングと人工知能 (AI...