機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

これには、機械学習のサブフィールドの分類が含まれます。すべての分類において、最初に尋ねるべき質問は、なぜそのように分けられているのかということです。どの次元で分割されますか?論理的な分類は人々の認知的枠組みを確立するのに役立ちますが、非論理的な分類は人々を混乱させる可能性があります。

1. 機械学習は人工知能のサブフィールドである

人工知能のサブフィールドは、歴史を通じて発展してきたため、比較的明確な特徴を持っています。大まかに分けると以下のようになります。

  •  推論期間  ”:自動定理証明やチェスシステムDeepBlueを含む検索に関する研究
  • 単に推論できるだけでは、幅広い知識を必要とする実践的な問題に対処することはできません。 「  知識期間  」、Prolog、さまざまなエキスパートシステム、今日の知識グラフを含む知識ベース推論を研究しています。
  • 知識を手作業で入力するだけでは、大規模なアプリケーションを実現することは困難です。 「  研究期間  「データから知識を要約する研究」であり、その成果には今日のさまざまなデータ分析およびマイニングシステムが含まれています。

「学習」が人工知能の主要な方向性であることが分かります。  機械学習  「トム・ミッチェルの定義によれば、経験からシステムのパフォーマンスを自動的に改善するプロセスです。経験はデータの形で提示されることが多いため、実際には機械学習がデータ分析の主なツールを提供します。つまり、今日のより詳細なデータの分析やモデルを要約する作業はすべて機械学習の範囲に含まれます。」

2. 機械学習タスクの分類

機械学習はデータからモデルを要約しますが、データによって表される経験にはさまざまな形式の情報が含まれる可能性があり、重要な情報の 1 つはモデルのパフォーマンスに関するフィードバックです。一部のデータにはモデルが出力すべき値が含まれており、一部のデータにはこの情報がまったく含まれておらず、一部のデータにはモデルのパフォーマンスのスコアが含まれています。フィードバック情報が異なると、それを処理するために異なるテクノロジーを使用する必要があります。したがって、異なるフィードバック情報に応じて、機械学習は一般的に 3 つのカテゴリに分類されます。

  • 教師あり学習  : モデルの正しい出力値、つまりラベル付きデータを含むプロセスを処理します。たとえば、画像認識データでは、各画像には対応する分類ラベルがあります。
  • 強化学習  :処理されたデータにはモデルのスコア値のみが含まれており、モデルが何を出力すべきかはわかりません。したがって、アルゴリズムに頼って継続的に探索し、最高スコアのモデル出力を見つけることしかできません。たとえば、囲碁では、各手に対する最適なガイダンスが不足しており、スコアを得る唯一の方法は最終的な勝ち負けであり、独自に探索して最適なモデルを見つけることです。
  • 教師なし学習  : データ内のモデル出力の品質を客観的に評価することはまったくできません。このとき、256次元の顔写真を4次元に圧縮するなど、何らかの学習目標を人為的に設定して学習を行うのが一般的です。この時点では、4次元がどのようなものであるべきかについての情報はありません。1つのアプローチは、4次元で256次元の顔を復元できるようにすることです。これは人為的に設定された目標です。このように自分の情報を復元する手法は、自己教師あり学習とも呼ばれます。名前に「教師あり」と付いていますが、実際は教師あり学習の技術を借用した教師なし学習の一種です。

この分類は機械学習のタスク次元に応じて分かれていることがわかります。もちろん、この区分には完全に明確な境界があるわけではありません。学際的な研究がますます発展するにつれて、多くの派生的な方向性が生まれてきました。

  • 教師あり学習×教師なし学習:例えば、データにはラベル付きデータとラベルなしデータが含まれています。ラベルなしデータを使用してモデルのパフォーマンスを向上させる方法の研究は、  半教師あり学習  弱い教師あり学習
  • 教師あり学習×強化学習:例えば、囲碁では人間の達人のデモンストレーションデータがあります。このデータを使って教師あり学習で人間の動きを真似ることができ、AlphaGoの初期バージョンでも使用されていました。このフィールドは 模倣学習
  • 強化学習 × 教師なし学習: たとえば、強化学習タスクではスコアリングが不足しており、アルゴリズムが環境を探索して独自に機能スキルを発見します。

上で述べた機械学習のサブフィールドは、実際には 帰納的学習 つまり、サンプルからルールを要約することです。帰納的学習は、その幅広い適用性により、「デフォルトの機械学習」となっています。しかし、実は機械学習には別のカテゴリが存在します。  演繹的学習 新しい知識を推測することで学習します。この方向性は、データ分析の人気によりこれまであまり注目されていませんでしたが、近年ではシンボリック AI の復活により成長しています。

3. 機械学習のモデル分類

初期の機械学習研究では、次のようなさまざまなインスピレーションに基づいたさまざまなモデルが作成されました。

  • 最近傍モデル
  • 決定木モデル
  • ベイズモデル
  • 線形モデル
  • 多層ニューラルネットワークモデル

など、初期の研究では、1 つの製品 ID が 1 つの製品に対応する、製品を購入したユーザーに関するデータなど、容量が小さく意味レベルが高いデータに主に焦点を当てていました。各ピクセルのグレースケール値で表される画像データなどのより低い意味レベルのデータの場合、画像内の顔を認識するには、グレースケール値と名前との関連を確立する必要があり、これは非常に大きな範囲です。波形で表される音声データの場合、単語を認識するには、音波の強度と単語との一連の関連を確立する必要があり、これは非常に大きな範囲です。そのため、達成されるパフォーマンスには限界があり、顔画像のグレースケールヒストグラム投影など、人工的に構築された高レベルの特徴に頼らなければならないことがよくあります。

2012年、一定の構造を持つ多層ニューラルネットワークモデルが大量のデータと組み合わされ、音声認識と画像認識において性能面での飛躍的な進歩を遂げ、広く注目を集めました。その後、大量の画像や音声データに適用した場合、より多層化されたニューラルネットワークモデルの利点がますます明らかになりました。従来のモデルと区別するために、このタイプのディープニューラルネットワークモデルは ディープラーニング 

その特徴は、特徴エンジニアリング + 従来のモデルとは異なり、ディープモデルは低レベルのセマンティックデータから上位レベルのタスクを直接学習することです。これは、いわゆる「エンドツーエンド」学習であり、データの表現の学習を自動的に含みます。逆に、表現学習を含むモデルでは通常、マルチレベル処理も必要となり、これはディープラーニングとも呼ばれます。ディープニューラルネットワークに加えて、ディープフォレストなどの非ニューラルネットワークモデルも存在します。

非ディープ/ディープ教師あり学習、非ディープ/ディープ強化学習、非ディープ/ディープ教師なし学習など、機械学習のタスクとモデルを組み合わせることができます。

<<:  TiDB v5.1 体験: TiDB で機械学習モデルをトレーニングしました

>>:  デジタル変革時代の産業用ロボットの5つの大きなトレンド

ブログ    

推薦する

業界に革命を起こすスマートパッケージング技術トップ10

ほとんどの人がサプライチェーン技術について考えるとき、パッケージングは​​おそらく最初に思い浮かぶも...

AIモデルのオープンソースの定義を変える必要がある

オープンソースライセンスは進化すべきだと思いますか? 2023年は人工知能(AI)の登場とともに新年...

千年紀の文化遺産の碑文を解読するAIの能力は人間より30%高い

科学技術の継続的な進歩により、人工知能(AI)はあらゆる面で常に人間を超えつつあるようだ。例えば、1...

TS と AI が出会うと何が起こるでしょうか?

人工知能は日々進歩しており、大規模な言語モデルはますます強力になっています。仕事に役立つ AI ツー...

...

2022 年のデータサイエンス、AI、機械学習の 5 つのトレンド

[[443145]] [51CTO.com クイック翻訳] 2022 年が近づくにつれ、人々は 20...

人工知能は飛躍の準備ができており、セキュリティは機会と課題に直面している

近年、人工知能はその地位の向上に伴い、国からますます注目を集めています。 2015年7月には「国務院...

アリババが自社開発したAI推論チップがリリース、Hanguang 800は他のチップより10倍強力

[51CTO.comよりオリジナル記事] 9月25日、DAMOアカデミーの張建鋒学長は杭州雲奇カンフ...

ウー・ジアン:nEqual は、優れたユーザー エクスペリエンスで企業がスマートなビジネスを構築できるよう支援します

[原文は51CTO.comより] 1月中旬に開催されたAdMaster再編メディアカンファレンスで、...

ロボットは自分で物事を行うことを学び、緩んだネジを自分で締めることができる。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

マイクロソフトは低コストのAIモデルを見つけるために多方面に賭けている

マイクロソフトはOpenAI LPの半分以下を所有していると言われているが、それでもパワーは劣るがよ...

ElasticSearch はどのようにして TDigest アルゴリズムを使用して数十億のデータのパーセンタイルを計算するのでしょうか?

[[393929]]この記事はWeChatの公開アカウント「プログラマー李小冰」から転載したもので...

...