人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

人工知能、機械学習、ディープラーニングをどのように区別するのでしょうか?

この記事は、LDV Partners のパートナーであるシリコンバレーの投資家レイク・ダイ氏によるものです。真剣に編集してまとめました。

人工知能 (AI) は最も広い概念です。AI の目的は、コンピューターを人間のように考えさせることです。機械学習は、コンピューターが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、パフォーマンスを継続的に向上させる方法を研究することに特化した AI の分野です。

ディープラーニングは、複雑な構造を含むアルゴリズムや、複数の非線形変換で構成される複数の処理層 (ニューラル ネットワーク) を使用して、データに対して高度な抽象化を実行しようとする機械学習手法です。

ニューラル ネットワークは、人間の脳を大まかにモデル化して、パターンを認識するように設計された一連のアルゴリズムです。ニューラル ネットワークは、機械認識システムを通じてセンサー データを解釈し、生の入力のラベル付けやクラスタリングなどの操作を実行できます。ニューラルネットワークが認識できるパターンは数値形式であるため、画像、音声、テキスト、時系列などの現実世界のデータはすべて数値に変換する必要があります。

ディープラーニング ネットワークでは、各層のノードは、前の層の出力に基づいて特定の特徴セットを認識することを学習します。ニューラル ネットワークの深さが増すにつれて、各層が前の層の機能を統合して再結合するため、ノードが認識できる機能はますます複雑になります。

(http://fortune.com/ai-artificial-intelligence-deep-machine-learning/)

上の図は、ニューラル ネットワークを使用して、画像が犬であるかどうかを判断するプロセスを示しています。入力は画像で、犬の低レベルの特徴がディープ ニューラル ネットワークを通じて抽象化されます。最終的な出力は、画像が犬である確率です。

ディープラーニングのプロセスも、トレーニングと推論(つまり「評価」)の 2 つのプロセスに分かれています。データ モデルはトレーニング プロセスを通じて取得され、新しいデータの評価に使用されます。

データ モデルには 2 つの種類があります。1 つはいわゆる識別モデルで、これはモデルを直接使用して物事を識別できることを意味します。ここで物事を判断する最も一般的な方法は分類です。分類に直接使用できるため、既知の属性の条件下でレコードを判断できます。したがって、判別モデルは条件付き確率、つまりp(Y|X)のモデリングです。ここで、X は属性のセットであり、実際にはベクトルです。Y は値 (分類問題に対応) またはベクトル (シーケンス ラベリング問題に対応) になります。識別モデルは、分類問題 (スパムの識別など) や画像認識などの処理によく使用されます。

生成モデルについてお話しましょう。生成モデルは、データを生成するプロセスを記述できます。言い換えれば、モデルがわかれば、そのモデルによって記述されたデータを生成できるということです。データは (X, Y) の 2 つの部分で構成され、前者は特徴であり、後者はカテゴリ (Y はスカラー) またはシーケンス カテゴリ (Y はベクトル) です。データ全体を記述するには、p(X,Y)をモデル化する必要があるため、結合確率をモデル化します。生成モデル自体は分類やシーケンスのラベル付けには使用されませんが、これらの問題を解決するために使用できます。また、チャットボットや AI 音楽作曲などの生成問題にも使用できます。

機械学習は次のカテゴリに分類できます。

  • 教師あり学習では、与えられたトレーニング データ セットから関数を学習し、新しいデータが到着すると、この関数に基づいて結果を予測できます。教師あり学習のトレーニング セットには、入力と出力、または特徴とターゲットが含まれている必要があります。トレーニング データ内のオブジェクトは人間によってラベル付けされます。一般的な教師あり学習アルゴリズムには、回帰分析や統計分類などがあります。
  • 教師あり学習と比較すると、教師なし学習ではトレーニング セットに人間がラベル付けした結果が含まれません。一般的な教師なし学習アルゴリズムはクラスタリングです。
  • 半教師あり学習は、教師あり学習と教師なし学習の中間です。主に、少数のラベル付きサンプルと多数のラベルなしサンプルをトレーニングと分類にどのように使用するかという問題を考慮します。 。
  • 強化学習は、観察を通じてアクションを実行する方法を学習します。それぞれのアクションは環境に影響を与え、学習オブジェクトは周囲の環境から観察されたフィードバックに基づいて判断を下します。

従来の機械学習の分野において、教師あり学習の最大の問題は、トレーニングデータのラベル付けのコストが比較的高いのに対し、教師なし学習の適用範囲が限られていることです。少量のトレーニング サンプルと大量のラベルなしデータを使用する半教師あり学習は、常に機械学習の研究の焦点となってきました。

現在非常に人気のあるディープラーニングのGANモデルは、半教師あり学習の考え方と共通点があります。GANは「Generative Adversarial Networks」の略称で、生成モデルGと識別モデルDを含みます。GANの目的関数はDとGのゼロサムゲームであり、これも最小化問題です。

GAN は実際には生成モデルと識別モデルの間の模倣ゲームです。生成モデルの目的は、実際のデータの分布パターンを可能な限り模倣、モデル化、学習することです。一方、識別モデルの目的は、取得した入力データが実際のデータ分布からのものか、生成モデルからのものかを判断することです。 2 つの内部モデル間の継続的な競争を通じて、2 つのモデルの生成能力と識別能力が向上します。

(Nvidia ディープラーニング トレーニング ワークショップの画像)

現在主流となっているディープラーニングフレームワーク:

  • カフェはバークレーによって提案された
  • Google の TensorFlow (Apache 2.0)
  • Torch(BSDライセンス)、Facebookが主なユーザー
  • MXNetはAmazon AWSで使用されている比較的中立的な機械学習フレームワーク(Apache 2.0)です。
  • Microsoft による CNTK2 (MIT ライセンス)

さまざまな業界で人工知能を活用している企業の分布

(画像出典: http://www.shivonzilis.com/)

各分野におけるAIスタートアップの現在の数(2016年のデータ):

  • ディープラーニング・機械学習(一般)(123社)
  • ディープラーニング・機械学習(応用)(260社)
  • NLP(一般)(154社)
  • NLP(音声認識)(78社)
  • コンピュータビジョン/画像認識(一般)(106社)
  • コンピュータビジョン/画像認識(アプリケーション)(83社)
  • ジェスチャーコントロール(33社)
  • バーチャルパーソナルアシスタント(92社)
  • 知能ロボット(65社)
  • レコメンデーションシステム(60社)
  • コンテキストアウェアコンピューティング(28社)
  • 音声翻訳(15社)
  • 動画認識(14社)

次の図は、さまざまな業界における人工知能の現在の人気を示しています。

上のグラフは、2011年から2016年にかけて人工知能企業に最も積極的に投資した投資家を示しています。

次の図は、Forbes が注目する 50 社の人工知能企業を示しています。

(画像: http://fortune.com/2017/02/23/artificial-intelligence-companies/ より)

最も資金提供を受けた AI スタートアップ (2011-2016)

Sentient Technologies: 高度な人工知能技術、大規模分散コンピューティング、科学的手法を使用して新たに発見された戦略を検証し、Sentient Technologies はさまざまな分野の複雑な問題に対する新しいソリューションを提供します。

Ayasdi: 機械学習プラットフォーム、データ可視化、分析、金融テクノロジー、ヘルスケアエージェントシステム:

Vicarious: これは謎の人工知能会社です。Vicarious の目標は「次世代の人工知能アルゴリズムを構築すること」です。また、同社は「人間のように考えるソフトウェア」を構築し、「人間レベルの視覚、言語、自動制御システム」を実現すると主張している。同社は汎用人工知能の研究に注力しており、現在は人工視覚認識システムの実現に注力している。

Context Relevant: Context Relevant は、機械学習を活用した自動化されたデータ サイエンス プラットフォームを使用して、他のどのソリューションよりも迅速かつ効果的に、世界で最も困難なビッグ データ、予測、行動の課題の一部を解決します。

Cortia: Cortica のテクノロジーは人間の大脳皮質をシミュレートし、これまでにない精度で画像を理解および認識します。

Workfusion: WorkFusion は、ビジネス プロセス管理 (BPM)、ロボティック プロセス自動化 (RPA)、ワークフォース オーケストレーション、機械学習を活用した認知自動化など、複雑なビジネス プロセスをデジタル化するために必要なコア機能を 1 つのプラットフォームに統合した、グローバル オペレーション向けの完全な自動化ソリューションです。

RapidMiner: 企業がビジネスプロセスに予測分析を組み込むことを可能にするオープンソースの予測分析プラットフォーム

デジタル推論システム: コンプライアンスを確保し、セキュリティを維持し、情報を迅速かつ正確に分析します。

H2O.ai: H2O は世界をリードするオープンソースのディープラーニング プラットフォームです。 H2O は、80,000 人を超えるデータ サイエンティストと 9,000 を超える組織で使用されています。

Viv Labs: Viv は音声起動型スマートアシスタントを開発しており、Samsung に買収されました。

参考文献:

http://fortune.com/ai-artificial-intelligence-deep-machine-learning/

https://en.wikipedia.org/wiki/人工ニューラルネットワーク

http://fortune.com/2017/02/23/artificial-intelligence-companies/

https://www.amazon.com/b?ie=UTF8&node=16008589011#

http://techemergence.com/artificial-intelligence-industry-an-overview-by-segment/

Nvidia ディープラーニング トレーニング ワークショップ

クランチベース

CBインサイト



<<:  顔認識の専門家、王国天氏:人工知能、機械学習、機械視覚とは何ですか?

>>:  ロボットが家庭に入り込み、家事を引き受け始めています。あなたのお気に入りはどれですか?

推薦する

心理意味論の観点から見た顔認識

人々は日常生活の中で、見知らぬ人の顔だけでなく、身近な親戚、友人、同僚、有名人の顔など、さまざまな顔...

ソフトウェアテストに AI を統合する 9 つのメリット

[[390945]] [51CTO.com 速訳]人工知能の普及は人々に大きな期待をもたらしました。...

...

消防ドローンはあらゆる能力に優れていることから人気が高まっています!

火災による被害は明らかですが、火災の予防と制御は容易ではありません。たとえば、森林火災は、その範囲が...

人民日報:教室規律における顔認識は目的ではなく手段

どの学校も生徒をより深く理解したいと考えていますが、テクノロジーを駆使した解決策の中には、満場一致で...

ジェネレーティブ AI と自動化: 未来のデータ センターを加速

自動化と生成型人工知能 (GenAI) の時代において、「データセンター」の本当の意味を再考する時が...

コンピュータービジョンにおける次の大きな進歩はどこから生まれるのでしょうか?

翻訳者 | ブガッティレビュー | Chonglou 1950 年代のコンピューター ビジョンの最初...

1行のコードでデバッグと印刷を排除し、アルゴリズムの学習を支援

[[442725]]この記事はWeChatの公開アカウント「Python Technology」から...

新たなレベルに到達しましょう!自動運転とインテリジェント交通における視覚言語モデルの最新の応用

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

この履歴書はAIの助けを借りて作成されたことが判明しました。 !

秋の就職活動は静かに過ぎ去りましたが、信頼できるインターンシップ先を見つけたい大学生にとって、すべて...

...

2021年の主なAIトレンド:AIチップスタートアップのM&Aの可能性

人工知能 (AI) と機械学習は、テクノロジーの意思決定者、業界の専門家、投資家にとって引き続き注目...

深い思考 | 大規模モデルの機能の限界はどこにあるのでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

最高裁判所は顔認識に関する司法解釈を発表し、無作為の「顔スキャン」に「ノー」と述べた。

今朝(8日)、第13期全国人民代表大会第5回会議第二回全体会議が開催され、最高人民法院と最高人民検察...