機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

これには、機械学習のサブフィールドの分類が含まれます。すべての分類において、最初に尋ねるべき質問は、なぜそのように分けられているのかということです。どの次元で分割されますか?論理的な分類は人々の認知的枠組みを確立するのに役立ちますが、非論理的な分類は人々を混乱させる可能性があります。

1. 機械学習は人工知能のサブフィールドである

人工知能のサブフィールドは、歴史を通じて発展してきたため、比較的明確な特徴を持っています。大まかに分けると以下のようになります。

「推論期間 ”：自動定理証明やチェスシステムDeepBlueを含む検索に関する研究
単に推論できるだけでは、幅広い知識を必要とする実践的な問題に対処することはできません。「知識期間」、Prolog、さまざまなエキスパートシステム、今日の知識グラフを含む知識ベース推論を研究しています。
知識を手作業で入力するだけでは、大規模なアプリケーションを実現することは困難です。「研究期間「データから知識を要約する研究」であり、その成果には今日のさまざまなデータ分析およびマイニングシステムが含まれています。

「学習」が人工知能の主要な方向性であることが分かります。機械学習「トム・ミッチェルの定義によれば、経験からシステムのパフォーマンスを自動的に改善するプロセスです。経験はデータの形で提示されることが多いため、実際には機械学習がデータ分析の主なツールを提供します。つまり、今日のより詳細なデータの分析やモデルを要約する作業はすべて機械学習の範囲に含まれます。」

2. 機械学習タスクの分類

機械学習はデータからモデルを要約しますが、データによって表される経験にはさまざまな形式の情報が含まれる可能性があり、重要な情報の 1 つはモデルのパフォーマンスに関するフィードバックです。一部のデータにはモデルが出力すべき値が含まれており、一部のデータにはこの情報がまったく含まれておらず、一部のデータにはモデルのパフォーマンスのスコアが含まれています。フィードバック情報が異なると、それを処理するために異なるテクノロジーを使用する必要があります。したがって、異なるフィードバック情報に応じて、機械学習は一般的に 3 つのカテゴリに分類されます。

教師あり学習 : モデルの正しい出力値、つまりラベル付きデータを含むプロセスを処理します。たとえば、画像認識データでは、各画像には対応する分類ラベルがあります。
強化学習：処理されたデータにはモデルのスコア値のみが含まれており、モデルが何を出力すべきかはわかりません。したがって、アルゴリズムに頼って継続的に探索し、最高スコアのモデル出力を見つけることしかできません。たとえば、囲碁では、各手に対する最適なガイダンスが不足しており、スコアを得る唯一の方法は最終的な勝ち負けであり、独自に探索して最適なモデルを見つけることです。
教師なし学習 : データ内のモデル出力の品質を客観的に評価することはまったくできません。このとき、256次元の顔写真を4次元に圧縮するなど、何らかの学習目標を人為的に設定して学習を行うのが一般的です。この時点では、4次元がどのようなものであるべきかについての情報はありません。1つのアプローチは、4次元で256次元の顔を復元できるようにすることです。これは人為的に設定された目標です。このように自分の情報を復元する手法は、自己教師あり学習とも呼ばれます。名前に「教師あり」と付いていますが、実際は教師あり学習の技術を借用した教師なし学習の一種です。

この分類は機械学習のタスク次元に応じて分かれていることがわかります。もちろん、この区分には完全に明確な境界があるわけではありません。学際的な研究がますます発展するにつれて、多くの派生的な方向性が生まれてきました。

教師あり学習×教師なし学習：例えば、データにはラベル付きデータとラベルなしデータが含まれています。ラベルなしデータを使用してモデルのパフォーマンスを向上させる方法の研究は、半教師あり学習、弱い教師あり学習
教師あり学習×強化学習：例えば、囲碁では人間の達人のデモンストレーションデータがあります。このデータを使って教師あり学習で人間の動きを真似ることができ、AlphaGoの初期バージョンでも使用されていました。このフィールドは模倣学習
強化学習 × 教師なし学習: たとえば、強化学習タスクではスコアリングが不足しており、アルゴリズムが環境を探索して独自に機能スキルを発見します。

上で述べた機械学習のサブフィールドは、実際には帰納的学習つまり、サンプルからルールを要約することです。帰納的学習は、その幅広い適用性により、「デフォルトの機械学習」となっています。しかし、実は機械学習には別のカテゴリが存在します。演繹的学習新しい知識を推測することで学習します。この方向性は、データ分析の人気によりこれまであまり注目されていませんでしたが、近年ではシンボリック AI の復活により成長しています。

3. 機械学習のモデル分類

初期の機械学習研究では、次のようなさまざまなインスピレーションに基づいたさまざまなモデルが作成されました。

最近傍モデル
決定木モデル
ベイズモデル
線形モデル
多層ニューラルネットワークモデル

など、初期の研究では、1 つの製品 ID が 1 つの製品に対応する、製品を購入したユーザーに関するデータなど、容量が小さく意味レベルが高いデータに主に焦点を当てていました。各ピクセルのグレースケール値で表される画像データなどのより低い意味レベルのデータの場合、画像内の顔を認識するには、グレースケール値と名前との関連を確立する必要があり、これは非常に大きな範囲です。波形で表される音声データの場合、単語を認識するには、音波の強度と単語との一連の関連を確立する必要があり、これは非常に大きな範囲です。そのため、達成されるパフォーマンスには限界があり、顔画像のグレースケールヒストグラム投影など、人工的に構築された高レベルの特徴に頼らなければならないことがよくあります。

2012年、一定の構造を持つ多層ニューラルネットワークモデルが大量のデータと組み合わされ、音声認識と画像認識において性能面での飛躍的な進歩を遂げ、広く注目を集めました。その後、大量の画像や音声データに適用した場合、より多層化されたニューラルネットワークモデルの利点がますます明らかになりました。従来のモデルと区別するために、このタイプのディープニューラルネットワークモデルはディープラーニング。

その特徴は、特徴エンジニアリング + 従来のモデルとは異なり、ディープモデルは低レベルのセマンティックデータから上位レベルのタスクを直接学習することです。これは、いわゆる「エンドツーエンド」学習であり、データの表現の学習を自動的に含みます。逆に、表現学習を含むモデルでは通常、マルチレベル処理も必要となり、これはディープラーニングとも呼ばれます。ディープニューラルネットワークに加えて、ディープフォレストなどの非ニューラルネットワークモデルも存在します。

非ディープ/ディープ教師あり学習、非ディープ/ディープ強化学習、非ディープ/ディープ教師なし学習など、機械学習のタスクとモデルを組み合わせることができます。

<<: TiDB v5.1 体験: TiDB で機械学習モデルをトレーニングしました

>>: デジタル変革時代の産業用ロボットの5つの大きなトレンド

機械学習、ディープラーニング、強化学習の関係と違いは何ですか?

1. 機械学習は人工知能のサブフィールドである

2. 機械学習タスクの分類

3. 機械学習のモデル分類

AI戦略について尋ねるべき10の質問

次世代ロボットは「人間と共存」するかもしれない。中国はこのチャンスをどうつかむのか？

Metaは、Llama 2を上回り、GPT-4に匹敵するパフォーマンスを備えた新しいオープンソースの大規模モデルを構築しています。

私のディープラーニング開発環境: TensorFlow + Docker + PyCharm など。あなたの環境はどうですか?

オープンソースの Gemma モデル: Google の言語の奇跡。命令チューニング、低ランク適応、Switch Transformer を使用して小さなモデルで遊ぶことができます。

AIの奇妙な使い方：マクドナルドはゴミ箱の監視にAIを活用

NLP モデルは人間のレベルを超えるか?大きな詐欺に遭ったかもしれない

機械学習とデータサイエンスのための最も人気のある Python ライブラリトップ 10

ディープラーニングのコードを信頼できるのはなぜでしょうか?

推薦する

マーケティングにおける人工知能の 4 つの実際の応用

可用性の高い Java 分散システムの構築: システムの安定性と信頼性の確保

テスラがテスラAIのTwitterアカウントを開設、Dojoスーパーコンピューターの生産を来月開始すると発表

「思考スタンプ」が実現！中国とアメリカの科学者33人の最新の成果：光を使って脳の認知を変える

スペルミスを心配する必要はありません。Microsoft Edge ブラウザに新しいウェブ「スマート検索」AI 機能が追加されます。

1 つの文で 10 万以上のコンテキストを持つ大規模モデルの真のパワーが発揮され、スコアが 27 から 98 に増加し、GPT-4 と Claude2.1 に適用可能

APICloud CEO 劉欣: モバイルアプリケーションは人工知能の実装にとって最も直接的な媒体である

AIは当面、都市のゴミ出しを支援できないかもしれない

シーメンスは自動化を推進力として変革の新たな機会を捉える

ZeroMat: データを一切使用せずにレコメンデーションシステムのコールドスタート問題を解決する

Reddit ユーザーが「泣く」: 私はアルゴリズムエンジニアではなく、「パラメータ調整者」です