人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

この記事は、LDV Partners のパートナーであるシリコンバレーの投資家レイク・ダイ氏によるものです。真剣に編集してまとめました。

人工知能 (AI) は最も広い概念です。AI の目的は、コンピューターを人間のように考えさせることです。機械学習は、コンピューターが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、パフォーマンスを継続的に向上させる方法を研究することに特化した AI の分野です。

ディープラーニングは、複雑な構造を含むアルゴリズムや、複数の非線形変換で構成される複数の処理層 (ニューラルネットワーク) を使用して、データに対して高度な抽象化を実行しようとする機械学習手法です。

ニューラルネットワークは、人間の脳を大まかにモデル化して、パターンを認識するように設計された一連のアルゴリズムです。ニューラルネットワークは、機械認識システムを通じてセンサーデータを解釈し、生の入力のラベル付けやクラスタリングなどの操作を実行できます。ニューラルネットワークが認識できるパターンは数値形式であるため、画像、音声、テキスト、時系列などの現実世界のデータはすべて数値に変換する必要があります。

ディープラーニングネットワークでは、各層のノードは、前の層の出力に基づいて特定の特徴セットを認識することを学習します。ニューラルネットワークの深さが増すにつれて、各層が前の層の機能を統合して再結合するため、ノードが認識できる機能はますます複雑になります。

（http://fortune.com/ai-artificial-intelligence-deep-machine-learning/）

上の図は、ニューラルネットワークを使用して、画像が犬であるかどうかを判断するプロセスを示しています。入力は画像で、犬の低レベルの特徴がディープニューラルネットワークを通じて抽象化されます。最終的な出力は、画像が犬である確率です。

ディープラーニングのプロセスも、トレーニングと推論（つまり「評価」）の 2 つのプロセスに分かれています。データモデルはトレーニングプロセスを通じて取得され、新しいデータの評価に使用されます。

データモデルには 2 つの種類があります。1 つはいわゆる識別モデルで、これはモデルを直接使用して物事を識別できることを意味します。ここで物事を判断する最も一般的な方法は分類です。分類に直接使用できるため、既知の属性の条件下でレコードを判断できます。したがって、判別モデルは条件付き確率、つまりp(Y|X)のモデリングです。ここで、X は属性のセットであり、実際にはベクトルです。Y は値 (分類問題に対応) またはベクトル (シーケンスラベリング問題に対応) になります。識別モデルは、分類問題 (スパムの識別など) や画像認識などの処理によく使用されます。

生成モデルについてお話しましょう。生成モデルは、データを生成するプロセスを記述できます。言い換えれば、モデルがわかれば、そのモデルによって記述されたデータを生成できるということです。データは (X, Y) の 2 つの部分で構成され、前者は特徴であり、後者はカテゴリ (Y はスカラー) またはシーケンスカテゴリ (Y はベクトル) です。データ全体を記述するには、p(X,Y)をモデル化する必要があるため、結合確率をモデル化します。生成モデル自体は分類やシーケンスのラベル付けには使用されませんが、これらの問題を解決するために使用できます。また、チャットボットや AI 音楽作曲などの生成問題にも使用できます。

機械学習は次のカテゴリに分類できます。

教師あり学習では、与えられたトレーニングデータセットから関数を学習し、新しいデータが到着すると、この関数に基づいて結果を予測できます。教師あり学習のトレーニングセットには、入力と出力、または特徴とターゲットが含まれている必要があります。トレーニングデータ内のオブジェクトは人間によってラベル付けされます。一般的な教師あり学習アルゴリズムには、回帰分析や統計分類などがあります。
教師あり学習と比較すると、教師なし学習ではトレーニングセットに人間がラベル付けした結果が含まれません。一般的な教師なし学習アルゴリズムはクラスタリングです。
半教師あり学習は、教師あり学習と教師なし学習の中間です。主に、少数のラベル付きサンプルと多数のラベルなしサンプルをトレーニングと分類にどのように使用するかという問題を考慮します。。
強化学習は、観察を通じてアクションを実行する方法を学習します。それぞれのアクションは環境に影響を与え、学習オブジェクトは周囲の環境から観察されたフィードバックに基づいて判断を下します。

従来の機械学習の分野において、教師あり学習の最大の問題は、トレーニングデータのラベル付けのコストが比較的高いのに対し、教師なし学習の適用範囲が限られていることです。少量のトレーニングサンプルと大量のラベルなしデータを使用する半教師あり学習は、常に機械学習の研究の焦点となってきました。

現在非常に人気のあるディープラーニングのGANモデルは、半教師あり学習の考え方と共通点があります。GANは「Generative Adversarial Networks」の略称で、生成モデルGと識別モデルDを含みます。GANの目的関数はDとGのゼロサムゲームであり、これも最小化問題です。

GAN は実際には生成モデルと識別モデルの間の模倣ゲームです。生成モデルの目的は、実際のデータの分布パターンを可能な限り模倣、モデル化、学習することです。一方、識別モデルの目的は、取得した入力データが実際のデータ分布からのものか、生成モデルからのものかを判断することです。 2 つの内部モデル間の継続的な競争を通じて、2 つのモデルの生成能力と識別能力が向上します。

(Nvidia ディープラーニングトレーニングワークショップの画像)

現在主流となっているディープラーニングフレームワーク:

カフェはバークレーによって提案された
Google の TensorFlow (Apache 2.0)
Torch（BSDライセンス）、Facebookが主なユーザー
MXNetはAmazon AWSで使用されている比較的中立的な機械学習フレームワーク（Apache 2.0）です。
Microsoft による CNTK2 (MIT ライセンス)

さまざまな業界で人工知能を活用している企業の分布

(画像出典: http://www.shivonzilis.com/)

各分野におけるAIスタートアップの現在の数（2016年のデータ）：

ディープラーニング・機械学習（一般）（123社）
ディープラーニング・機械学習（応用）（260社）
NLP（一般）（154社）
NLP（音声認識）（78社）
コンピュータビジョン/画像認識（一般）（106社）
コンピュータビジョン/画像認識（アプリケーション）（83社）
ジェスチャーコントロール（33社）
バーチャルパーソナルアシスタント（92社）
知能ロボット（65社）
レコメンデーションシステム（60社）
コンテキストアウェアコンピューティング（28社）
音声翻訳（15社）
動画認識（14社）

次の図は、さまざまな業界における人工知能の現在の人気を示しています。

上のグラフは、2011年から2016年にかけて人工知能企業に最も積極的に投資した投資家を示しています。

次の図は、Forbes が注目する 50 社の人工知能企業を示しています。

(画像: http://fortune.com/2017/02/23/artificial-intelligence-companies/ より)

最も資金提供を受けた AI スタートアップ (2011-2016)

Sentient Technologies: 高度な人工知能技術、大規模分散コンピューティング、科学的手法を使用して新たに発見された戦略を検証し、Sentient Technologies はさまざまな分野の複雑な問題に対する新しいソリューションを提供します。

Ayasdi: 機械学習プラットフォーム、データ可視化、分析、金融テクノロジー、ヘルスケアエージェントシステム:

Vicarious: これは謎の人工知能会社です。Vicarious の目標は「次世代の人工知能アルゴリズムを構築すること」です。また、同社は「人間のように考えるソフトウェア」を構築し、「人間レベルの視覚、言語、自動制御システム」を実現すると主張している。同社は汎用人工知能の研究に注力しており、現在は人工視覚認識システムの実現に注力している。

Context Relevant: Context Relevant は、機械学習を活用した自動化されたデータサイエンスプラットフォームを使用して、他のどのソリューションよりも迅速かつ効果的に、世界で最も困難なビッグデータ、予測、行動の課題の一部を解決します。

Cortia: Cortica のテクノロジーは人間の大脳皮質をシミュレートし、これまでにない精度で画像を理解および認識します。

Workfusion: WorkFusion は、ビジネスプロセス管理 (BPM)、ロボティックプロセス自動化 (RPA)、ワークフォースオーケストレーション、機械学習を活用した認知自動化など、複雑なビジネスプロセスをデジタル化するために必要なコア機能を 1 つのプラットフォームに統合した、グローバルオペレーション向けの完全な自動化ソリューションです。

RapidMiner: 企業がビジネスプロセスに予測分析を組み込むことを可能にするオープンソースの予測分析プラットフォーム

デジタル推論システム: コンプライアンスを確保し、セキュリティを維持し、情報を迅速かつ正確に分析します。

H2O.ai: H2O は世界をリードするオープンソースのディープラーニングプラットフォームです。 H2O は、80,000 人を超えるデータサイエンティストと 9,000 を超える組織で使用されています。

Viv Labs: Viv は音声起動型スマートアシスタントを開発しており、Samsung に買収されました。

参考文献:

http://fortune.com/ai-artificial-intelligence-deep-machine-learning/

https://en.wikipedia.org/wiki/人工ニューラルネットワーク

http://fortune.com/2017/02/23/artificial-intelligence-companies/

https://www.amazon.com/b?ie=UTF8&node=16008589011#

http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/

Nvidia ディープラーニングトレーニングワークショップ

クランチベース