ディープラーニングと従来の機械学習のメリットとデメリット!

ディープラーニングと従来の機械学習のメリットとデメリット!

過去数年間、ディープラーニングは、従来の機械学習を凌駕し、ほとんどの AI 型の問題に対する頼りになる技術になりました。その明白な理由は、ディープラーニングが、音声、自然言語、視覚、ゲームプレイなど、さまざまなタスクで優れたパフォーマンスを繰り返し実証してきたからです。ただし、ディープラーニングのパフォーマンスが高いにもかかわらず、大規模なディープネットワークではなく、従来の機械学習と線形回帰または決定木を使用する方がよい特定のケースがまだいくつかあります。

この記事では、ディープラーニングと従来の機械学習技術を比較します。そうすることで、両方のテクノロジーの長所と短所、そしてそれらがどこでどのように普及しているかを特定します。

[[225298]]

ディープラーニング > 従来の機械学習

最高のパフォーマンス: ディープ ネットワークは、音声、自然言語、視覚、ゲーム プレイなど多くの分野において、従来の ML 手法をはるかに上回る精度を実現しています。多くのタスクでは、従来の ML では競争することすらできません。たとえば、下の図は、ImageNet データセットにおけるさまざまな方法による画像分類の精度を示しています。青は従来の ML 方法、赤は深層畳み込みニューラル ネットワーク (CNN) 方法を表しています。

データに応じて効率的に拡張: ディープ ネットワークは、従来の ML アルゴリズムよりも多くのデータに応じて適切に拡張されます。下の図はシンプルですが効果的な例です。多くの場合、より深いネットワークで精度を向上させるための最善のアドバイスは、より多くのデータを使用することです。従来の ML アルゴリズムでは、この迅速かつ簡単な修正はほとんど機能せず、精度を向上させるにはより洗練された方法が必要になることがよくあります。

特徴エンジニアリングは不要: 従来の ML アルゴリズムでは通常、複雑な特徴エンジニアリングが必要です。まず、データセットに対して詳細な探索的データ分析を実行し、その後に単純な次元削減を実行します。 ***、*** 機能は、ML アルゴリズムに渡すために慎重に選択する必要があります。ディープ ネットワークを使用する場合、通常はデータを直接ネットワークに渡すだけで良好なパフォーマンスが得られるため、これは必要ありません。これにより、プロセス全体における大規模で困難な機能エンジニアリング フェーズが完全に排除されます。

高い適応性と容易な変換: 従来の ML アルゴリズムと比較して、ディープラーニング技術はさまざまな分野やアプリケーションに簡単に適応できます。まず、転移学習により、事前トレーニング済みのディープ ネットワークを同じドメイン内のさまざまなアプリケーションに効果的に適応できるようになります。

たとえば、コンピューター ビジョンでは、事前トレーニング済みの画像分類ネットワークが、オブジェクト検出およびセグメンテーション ネットワークの特徴抽出フロントエンドとしてよく使用されます。これらの事前トレーニング済みのネットワークをフロントエンドとして使用すると、モデル全体のトレーニングが容易になり、より短時間でより高いパフォーマンスを実現できるようになります。さらに、さまざまな分野で使用されているディープラーニングの基本的な考え方や手法は、多くの場合、転用可能です。

たとえば、音声認識の分野における基礎となるディープラーニング理論を理解すれば、基礎知識が非常に似ているため、ディープネットワークを自然言語処理に適用する方法を学ぶことはそれほど難しくありません。これは従来の ML には当てはまりません。高性能な ML モデルを構築するには、ドメイン固有およびアプリケーション固有の ML テクニックと機能エンジニアリングが必要です。従来の ML の知識ベースはドメインやアプリケーションによって大きく異なり、多くの場合、各領域ごとに広範囲にわたる専門的な研究が必要になります。

従来の機械学習 > ディープラーニング

小規模データに最適: 高いパフォーマンスを実現するには、ディープ ネットワークに非常に大きなデータセットが必要です。前述の事前トレーニング済みネットワークは、120 万枚の画像でトレーニングされました。多くのアプリケーションでは、このような大規模なデータセットを入手するのは容易ではなく、入手には費用と時間がかかります。データセットが小さい場合、従来の ML アルゴリズムはディープ ネットワークよりも優れたパフォーマンスを発揮することがよくあります。

コストと計算コストが安価: ディープ ネットワークでは、大量のデータを妥当な時間でトレーニングするためにハイエンドの GPU が必要です。これらの GPU は非常に高価ですが、これらがなければ、ディープ ネットワークをトレーニングして高いパフォーマンスを達成することは実際には不可能です。このようなハイエンド GPU を効果的に使用するには、高速な CPU、SSD ストレージ、高速で大容量の RAM も必要です。従来の ML アルゴリズムは、最先端のハードウェアを必要とせず、適切な CPU だけで十分にトレーニングできます。計算コストが高くないため、より高速に反復処理を実行し、より短時間でさまざまな手法を試すことができます。

理解しやすい: 従来の ML には直接的な特徴エンジニアリングが組み込まれているため、これらのアルゴリズムは説明しやすく理解しやすいです。さらに、データと基礎となるアルゴリズムの両方をより完全に理解できるため、ハイパーパラメータを調整したり、モデル設計を変更したりすることが容易になります。一方、ディープネットワークは「ブラックボックス」型であり、現在でも研究者はディープネットワークの「内部」を完全に理解することはできません。理論的基礎が不足しているため、ハイパーパラメータとネットワーク設計も大きな課題となっています。

<<:  [ディープラーニングシリーズ] PaddlePaddleとTensorflowによる画像分類

>>:  大学は人工知能人材育成に力を入れており、「ロボット工学」専攻が人気に

ブログ    

推薦する

...

TensorFlow を通じてディープラーニング アルゴリズムを実装し、企業の実務に適用する方法

この記事は、Caiyun Technology のトップ ビッグ データ サイエンティストである Z...

DevOps で AI を使用して非線形スケーリングを実現する方法

テクノロジーが飛躍的に進歩するにつれ、AI はスピード、スケーラビリティ、品質、柔軟性を求めるあらゆ...

Ant Group の大規模セマンティック知識管理における主要技術と実践

1. Ant Financial Knowledge Graph プラットフォームの紹介まず、ナレッ...

AI葬儀:ロボットに自分の葬儀を執り行ってもらう勇気はありますか?

スマートな葬儀は常に議論の的となっている話題です。現状では、スマート葬儀サービスの応用製品にはまだま...

...

...

...

...

危険な環境を恐れず、人工知能配信ネットワークライブ操作ロボットが重い責任を勇敢に引き受けます

現在、産業、農業、住民の電力消費は急速に増加しており、風力発電、水力発電などの電源が電力供給の主な手...

靴下が山積みになっています。靴下をペアにするには、最も速くて効率的なアルゴリズムをどのように使用すればよいでしょうか?

[問題の説明]昨日、コインランドリーで靴下の山を整理していたのですが、自分が使っていた方法がとても...

...

...

GitHubのレポートによると、米国のプログラマーの92%がAIツールを使用している

オンラインコードホスティングプラットフォームのGitHubは最近、従業員1,000人以上の米国企業を...

CCTV:AI修復により、生産ラインから出荷された国産車の最初のバッチを再現

IT Homeは7月4日、解放CA10トラックが1956年7月に生産ラインから出荷されたと報じた。こ...