人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

この記事は、LDV Partners のパートナーであるシリコンバレーの投資家レイク・ダイ氏によるものです。真剣に編集してまとめました。

人工知能 (AI) は最も広い概念です。AI の目的は、コンピューターを人間のように考えさせることです。機械学習は、コンピューターが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、パフォーマンスを継続的に向上させる方法を研究することに特化した AI の分野です。

ディープラーニングは、複雑な構造を含むアルゴリズムや、複数の非線形変換で構成される複数の処理層 (ニューラル ネットワーク) を使用して、データに対して高度な抽象化を実行しようとする機械学習手法です。

ニューラル ネットワークは、人間の脳を大まかにモデル化して、パターンを認識するように設計された一連のアルゴリズムです。ニューラル ネットワークは、機械認識システムを通じてセンサー データを解釈し、生の入力のラベル付けやクラスタリングなどの操作を実行できます。ニューラルネットワークが認識できるパターンは数値形式であるため、画像、音声、テキスト、時系列などの現実世界のデータはすべて数値に変換する必要があります。

ディープラーニング ネットワークでは、各層のノードは、前の層の出力に基づいて特定の特徴セットを認識することを学習します。ニューラル ネットワークの深さが増すにつれて、各層が前の層の機能を統合して再結合するため、ノードが認識できる機能はますます複雑になります。

(http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

上の図は、ニューラル ネットワークを使用して、画像が犬であるかどうかを判断するプロセスを示しています。入力は画像で、犬の低レベルの特徴がディープ ニューラル ネットワークを通じて抽象化されます。最終的な出力は、画像が犬である確率です。

ディープラーニングのプロセスも、トレーニングと推論(つまり「評価」)の 2 つのプロセスに分かれています。データ モデルはトレーニング プロセスを通じて取得され、新しいデータの評価に使用されます。

データ モデルには 2 つの種類があります。1 つはいわゆる識別モデルで、これはモデルを直接使用して物事を識別できることを意味します。ここで物事を判断する最も一般的な方法は分類です。分類に直接使用できるため、既知の属性の条件下でレコードを判断できます。したがって、判別モデルは条件付き確率、つまりp(Y|X)のモデリングです。ここで、X は属性のセットであり、実際にはベクトルです。Y は値 (分類問題に対応) またはベクトル (シーケンス ラベリング問題に対応) になります。識別モデルは、分類問題 (スパムの識別など) や画像認識などの処理によく使用されます。

生成モデルについてお話しましょう。生成モデルは、データを生成するプロセスを記述できます。言い換えれば、モデルがわかれば、そのモデルによって記述されたデータを生成できるということです。データは (X, Y) の 2 つの部分で構成され、前者は特徴であり、後者はカテゴリ (Y はスカラー) またはシーケンス カテゴリ (Y はベクトル) です。データ全体を記述するには、p(X,Y)をモデル化する必要があるため、結合確率をモデル化します。生成モデル自体は分類やシーケンスのラベル付けには使用されませんが、これらの問題を解決するために使用できます。また、チャットボットや AI 音楽作曲などの生成問題にも使用できます。

機械学習は次のカテゴリに分類できます。

  • 教師あり学習では、与えられたトレーニング データ セットから関数を学習し、新しいデータが到着すると、この関数に基づいて結果を予測できます。教師あり学習のトレーニング セットには、入力と出力、または特徴とターゲットが含まれている必要があります。トレーニング データ内のオブジェクトは人間によってラベル付けされます。一般的な教師あり学習アルゴリズムには、回帰分析や統計分類などがあります。
  • 教師あり学習と比較すると、教師なし学習ではトレーニング セットに人間がラベル付けした結果が含まれません。一般的な教師なし学習アルゴリズムはクラスタリングです。
  • 半教師あり学習は、教師あり学習と教師なし学習の中間です。主に、少数のラベル付きサンプルと多数のラベルなしサンプルをトレーニングと分類にどのように使用するかという問題を考慮します。 。
  • 強化学習は、観察を通じてアクションを実行する方法を学習します。それぞれのアクションは環境に影響を与え、学習オブジェクトは周囲の環境から観察されたフィードバックに基づいて判断を下します。

従来の機械学習の分野において、教師あり学習の最大の問題は、トレーニングデータのラベル付けのコストが比較的高いのに対し、教師なし学習の適用範囲が限られていることです。少量のトレーニング サンプルと大量のラベルなしデータを使用する半教師あり学習は、常に機械学習の研究の焦点となってきました。

現在非常に人気のあるディープラーニングのGANモデルは、半教師あり学習の考え方と共通点があります。GANは「Generative Adversarial Networks」の略称で、生成モデルGと識別モデルDを含みます。GANの目的関数はDとGのゼロサムゲームであり、これも最小化問題です。

GAN は実際には生成モデルと識別モデルの間の模倣ゲームです。生成モデルの目的は、実際のデータの分布パターンを可能な限り模倣、モデル化、学習することです。一方、識別モデルの目的は、取得した入力データが実際のデータ分布からのものか、生成モデルからのものかを判断することです。 2 つの内部モデル間の継続的な競争を通じて、2 つのモデルの生成能力と識別能力が向上します。

(Nvidia ディープラーニング トレーニング ワークショップの画像)

現在主流となっているディープラーニングフレームワーク:

  • カフェはバークレーによって提案された
  • Google の TensorFlow (Apache 2.0)
  • Torch(BSDライセンス)、Facebookが主なユーザー
  • MXNetはAmazon AWSで使用されている比較的中立的な機械学習フレームワーク(Apache 2.0)です。
  • Microsoft による CNTK2 (MIT ライセンス)

さまざまな業界で人工知能を活用している企業の分布

(画像出典: http://www.shivonzilis.com/)

各分野におけるAIスタートアップの現在の数(2016年のデータ):

  • ディープラーニング・機械学習(一般)(123社)
  • ディープラーニング・機械学習(応用)(260社)
  • NLP(一般)(154社)
  • NLP(音声認識)(78社)
  • コンピュータビジョン/画像認識(一般)(106社)
  • コンピュータビジョン/画像認識(アプリケーション)(83社)
  • ジェスチャーコントロール(33社)
  • バーチャルパーソナルアシスタント(92社)
  • 知能ロボット(65社)
  • レコメンデーションシステム(60社)
  • コンテキストアウェアコンピューティング(28社)
  • 音声翻訳(15社)
  • 動画認識(14社)

次の図は、さまざまな業界における人工知能の現在の人気を示しています。

上のグラフは、2011年から2016年にかけて人工知能企業に最も積極的に投資した投資家を示しています。

次の図は、Forbes が注目する 50 社の人工知能企業を示しています。

(画像: http://fortune.com/2017/02/23/artificial-intelligence-companies/ より)

最も資金提供を受けた AI スタートアップ (2011-2016)

Sentient Technologies: 高度な人工知能技術、大規模分散コンピューティング、科学的手法を使用して新たに発見された戦略を検証し、Sentient Technologies はさまざまな分野の複雑な問題に対する新しいソリューションを提供します。

Ayasdi: 機械学習プラットフォーム、データ可視化、分析、金融テクノロジー、ヘルスケアエージェントシステム:

Vicarious: これは謎の人工知能会社です。Vicarious の目標は「次世代の人工知能アルゴリズムを構築すること」です。また、同社は「人間のように考えるソフトウェア」を構築し、「人間レベルの視覚、言語、自動制御システム」を実現すると主張している。同社は汎用人工知能の研究に注力しており、現在は人工視覚認識システムの実現に注力している。

Context Relevant: Context Relevant は、機械学習を活用した自動化されたデータ サイエンス プラットフォームを使用して、他のどのソリューションよりも迅速かつ効果的に、世界で最も困難なビッグ データ、予測、行動の課題の一部を解決します。

Cortia: Cortica のテクノロジーは人間の大脳皮質をシミュレートし、これまでにない精度で画像を理解および認識します。

Workfusion: WorkFusion は、ビジネス プロセス管理 (BPM)、ロボティック プロセス自動化 (RPA)、ワークフォース オーケストレーション、機械学習を活用した認知自動化など、複雑なビジネス プロセスをデジタル化するために必要なコア機能を 1 つのプラットフォームに統合した、グローバル オペレーション向けの完全な自動化ソリューションです。

RapidMiner: 企業がビジネスプロセスに予測分析を組み込むことを可能にするオープンソースの予測分析プラットフォーム

デジタル推論システム: コンプライアンスを確保し、セキュリティを維持し、情報を迅速かつ正確に分析します。

H2O.ai: H2O は世界をリードするオープンソースのディープラーニング プラットフォームです。 H2O は、80,000 人を超えるデータ サイエンティストと 9,000 を超える組織で使用されています。

Viv Labs: Viv は音声起動型スマートアシスタントを開発しており、Samsung に買収されました。

参考文献:

http://fortune.com/ai-artificial-intelligence-deep-machine-learning/

https://en.wikipedia.org/wiki/人工ニューラルネットワーク

http://fortune.com/2017/02/23/artificial-intelligence-companies/

https://www.amazon.com/b?ie=UTF8&node=16008589011#

http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/

Nvidia ディープラーニング トレーニング ワークショップ

クランチベース

CBインサイト



<<:  顔認識の専門家、王国天氏:人工知能、機械学習、機械視覚とは何ですか?

>>:  ロボットが家庭に入り込み、家事を引き受け始めています。あなたのお気に入りはどれですか?

ブログ    
ブログ    

推薦する

CAIOは企業が緊急に必要とする人材になりつつある

数え切れないほど多くの企業が AI 技術の研究や導入に競い合う中、多くの企業が熟練した AI チーム...

Google 検索は年間 890 回以上改善され、そのコア アルゴリズムは毎日変更されます。

8月21日、Googleの検索事業責任者アミット・シンガル氏はGoogle+に記事を掲載し、過去1...

このトレンドは止められない!すべてのデータ サイエンティストが知っておくべき 5 つのグラフ アルゴリズム

すべてがつながっている世界では、ユーザーは独立した個人ではなく、何らかの形で互いにつながっています。...

...

...

...

小売業界における人工知能の応用

多くの小売業者にとって、2020年のコロナウイルスの流行は、その存続と運営に深刻な影響を及ぼしました...

カーネルモデル化ガウス過程 (KMGP) を使用したデータモデリング

カーネル モデル ガウス過程 (KMGP) は、さまざまなデータセットの複雑さを処理できる高度なツー...

インドネシアのゴミ分別:人工知能が役に立つ

上海市は7月に「史上最も厳しいゴミ分別措置」を実施し始めて以来、ゴミ分別は多くの人々の日常生活におけ...

Nature: 機械視覚による行動理解と脳神経の間には本質的なつながりがあるのでしょうか?上海交通大学のLu Cewu氏のチームはマッピングモデルを構築した

被験者が特定の行動をとったとき、その脳はそれに対応する安定した脳神経パターンのマッピングを生成するで...

...

...

Nature の論文が xAI の目標を検証、人間の認知 AI が宇宙の本質を探る、マスク氏: 黙ってろ、金やるぞ!

馬氏は数日前にAIを使って宇宙の本質を探究することを目的としたAI企業xAIを発表したばかりだ。幸運...

...

ChatGPTが公式検出ツールを削除、AIテキストは識別できないことを認める

OpenAI は、何の発表もなく、ひっそりと AI テキスト検出ツールをシャットダウンし、ページは直...