機械学習、人工知能、ディープラーニングの関係は何ですか?ついに誰かが明らかにした

「機械学習」、「人工知能」、「ディープラーニング」という 3 つの用語は混同されることが多いですが、実際には、これらは非常に離れた時期に登場しました。「人工知能」(AI) は 1950 年代に登場し、「機械学習」(ML) は 1980 年代に登場し、「ディープラーニング」(DL) は近年になって登場しました。図1-1に示すように、3つは包含と包含される関係にあります。

▲図1-1 人工知能、機械学習、ディープラーニングの関係

上記の関係については、業界内でもさまざまな見解があります。たとえば、ディープラーニングの一部の側面は機械学習の範囲外であると考える人もいますが、ここでは取り上げません。

01 機械学習と人工知能

「人工知能」という用語は、1956年のダートマス会議で登場しました。当時、人工知能の先駆者たちの夢は、人間の知能を備えたソフトウェアとハードウェアのシステムを構築することでした。そのシステムは人間の知能の特徴を備えており、ここで言及されている人工知能は「汎用人工知能」でした。

こうした人工知能の夢は、映画「スターウォーズ」に登場する人間並みの理性や思考力を持つロボット「C-3PO」など、映画やテレビ作品でも輝いています。しかし、現時点では、こうした高度な推論や思考を実現するのは依然として困難です。次善の策として、現在実装できるのは顔認識などの「狭義の人工知能」ばかりです。

機械学習を人工知能への方法論的アプローチとして説明します。機械学習とは、既存のデータ、知識、または経験に基づいて意味のあるパターンを自動的に識別することです。最も基本的な意味では、機械学習はアルゴリズムを使用してデータを解釈し、データから学習し、同様のコンテキストで決定や予測を行います。つまり、データに基づいて学習し、意思決定を行うことを意味します。この説明は、機械学習を従来のソフトウェアや通常のプログラムと区別します。

機械学習プロセスでは、機械学習システムが未知の環境についてどのように決定または予測を行うべきかについて、人間による指示はありません。このプロセスは、機械学習アルゴリズムによってデータから学習されます。意思決定主体は機械学習アルゴリズムであり、決定または予測は非決定論的な結果であり、通常は晴れの確率が 80% などの確率の形で出力されます。

対照的に、従来のアプリケーションでは、ソフトウェアエンジニアが、登録の成功と失敗をそれぞれ示すために 0 と 1 を出力するなど、プログラムまたはソフトウェアに特定の動作を実行するように指示するコード (特定の命令セット) を 1 つずつ記述する必要があります。決定を下す主体は実際には人間であり、プログラムはアクションを実行するための単なるツールです。このため、機械学習は従来のプログラミングとは対照的に、間接プログラミングとして分類できます。

02 機械学習とディープラーニング

ディープラーニングでは、多層（通常 5 層以上）の人工ニューラルネットワークを使用して、データ内の複雑な関係を学習します。人工ニューラルネットワークは、生物学、認知科学、人工知能の組み合わせの産物です。初期の機械学習で使用されてきました。当初の目的は、コンピューターで人間の脳のニューロンの動作モードをシミュレートすることでした。

人間の脳には数百億のニューロンがあり、シナプスを通じて互いに通信しますが、これは計算の観点から見ると膨大な計算量です。そのため、実際には複雑な人工ニューラルネットワークの応用には限界があります。コンピュータの計算能力の大幅な向上は、新たな可能性をもたらしました。2000年、トロント大学のジェフリー・ヒントン率いる研究チームは、たゆまぬ研究の末、ついに現代のスーパーコンピュータにおけるディープラーニングの多層ネットワーク構造を検証しました。

ジェフリー・ヒントンは、ディープラーニングの分野における多大な貢献によりディープラーニングの創始者として知られており、ヨシュア・ベンジオ、ヤン・ルカンとともに機械学習の三大巨頭の一人として知られています。（3人はディープラーニングへの貢献により2018年のチューリング賞を受賞しました。

ディープラーニングは、機械学習のサブセットである機械学習を実装するための技術として考えることができます。ディープラーニングとは対照的に、以前は単一層または数層のみのニューラルネットワークは、浅い学習と呼ばれていました。

専門家の中には、ある現象を説明するために、機械学習を冗談交じりに説明する人もいます。資金調達のときは人工知能に属し、採用のときは機械学習に属し、実行のときは線形回帰に属し、デバッグのときは printf() に属します。

上記は、人工知能、機械学習、ディープラーニングの関係を一面から簡単に説明したものです。より包括的な情報については、関連資料を参照してください。

03 機械学習と統計、ビッグデータとデータサイエンス

機械学習は従来の統計学と切り離せないものであり、どちらもデータから結論を導き出すことが含まれます。統計学では、データ空間の仮定（例えば、データは正規分布している）の下でパラメトリックな解法が最初に提案されましたが、サンプルサイズが無限に増加した場合の統計的推定値の収束に関心がありました。機械学習では、データ分布に関する仮定をできるだけ少なくし、有限サンプルでの学習のパフォーマンス（アルゴリズムとモデルの性能）に注目しながら、データ生成に近いモデルを学習するためのアルゴリズムをキーとして使用します。

機械学習とビッグデータは、同じ文脈で登場することがよくあります。誰かがビッグデータについて言及したとき、その人がビッグデータで何を意味しているのかを理解するためには、その人の背景を見る必要があります。

この人がビッグデータ関連の技術者であり、技術的な観点からビッグデータを説明する場合、データの保存、分析、処理、計算の技術を指すことが多い。難しさは特定のアルゴリズムにあるのではなく、保存と計算の分散システムの階層的な問題にある。業界では、大量のデータをモデル化するために比較的単純なアルゴリズムが使用されることが多いこともわかります。

逆に、データ量が少ない場合は、入手が困難なため、詳細な分析や処理が必要になる場合が多くあります。ある日の天気に基づいて別の日の天気を推測することは困難ですが、過去の天気データが大量にある場合は、従来のアルゴリズムを使用して別の日の天気をより自信を持って推測できます。

ある意味、「ビッグデータは難しくないが、スモールデータが難しい」という言葉にはある程度の真実が含まれています。この人がビジネスの観点からビッグデータを説明する場合、多くの場合、データ、データ分析、マイニング、運用、ビジネス価値の創出に基づく方法と戦略について言及します。

一般人がビッグデータについて話すとき、彼らは大量のデータ、セキュリティ、プライバシーなどのより直感的な概念を指すことが多いです。多くのシナリオでは、実際にアルゴリズムモデルに入力されるデータの量について、「本当にビッグデータがあるのだろうか?」と自問する必要があることに言及する価値があります。

もちろん、機械学習に使用されるデータはさまざまなチャネルから取得され、データ量は膨大で、ビッグデータプラットフォームまたはビッグデータストレージシステムに保存されます。この観点から見ると、機械学習はビッグデータに依存しています。さらに、ビッグデータ（およびその処理能力）は、従来のデータ分析モデリングを機械学習やディープラーニングに変革するための鍵でもあります。

機械学習はデータサイエンスとも密接に関連しています。データサイエンスは、データに関する活動をデータの観点からまとめたもので、機械学習よりも範囲が広いと私は考えています。データエンジニアリング、データ視覚化、データ統合と ETL (抽出、変換、ロード)、ビジネスインテリジェンス、データ製品、ビッグデータなどはすべてデータサイエンスに分類できます。

<<: 大好きです！初心者に適した 7 つの高品質 AI プロジェクト

>>: 機械学習を推奨するマーケティングアカウントが増えています。これは本当に信頼できるのでしょうか?