機械学習の話題は誰もが話題にするほど普及していますが、それを完全に理解している人はほとんどいません。インターネット上の機械学習に関する記事の中には、理解しにくいものや理論的すぎるもの、あるいは人工知能、データサイエンス、将来の仕事の魔法についての漠然とした紹介でいっぱいのものなどがあります。
しかし、ディープラーニングはニューラルネットワークに関するものなのでしょうか?もちろん、必ずしもそうとは限りません。たとえば、周志華教授の Deep Forest は、微分不可能なコンポーネントに基づく最初のディープラーニング モデルです。したがって、より科学的な区分は次のようになります。 機械学習の下には表現学習があり、これは機械学習を使用して表現自体をマイニングするすべての方法をまとめたものです。データ機能を手動で設計する必要がある従来の ML と比較して、このタイプの方法では、有用なデータ機能を自ら学習できます。ディープラーニング全体も一種の表現学習であり、レイヤーごとのモデルを通じて単純な表現から複雑な表現を構築します。 現在の主流の分類によれば、機械学習は主に次の 4 つのカテゴリに分類されます。
古典的な機械学習<br /> 従来の機械学習は、多くの場合、教師あり学習と教師なし学習の 2 つのカテゴリに分けられます。 教師あり学習<br /> 分類では、モデルには常にメンター、つまり対応する特徴の注釈が必要であり、これによりマシンはこれらの注釈に基づいてさらに分類することを学習できます。すべてを分類することができ、ユーザーを興味に基づいて分類したり、記事を言語と主題に基づいて分類したり、音楽をジャンルに基づいて分類したり、電子メールをキーワードに基づいて分類したりできます。 サポート ベクター マシン (SVM) は、最も人気のある古典的な分類方法です。また、写真や文書内の植物の外観など、存在するすべてのものを分類するためにも使用されます。サポート ベクター マシンの背後にある考え方も非常にシンプルです。次の図を例に挙げてみましょう。データ ポイント間のマージンが最大となる 2 本の線を描画しようとします。 教師あり学習 — 回帰<br /> 回帰は基本的に分類ですが、予測されるターゲットはカテゴリではなく数値です。たとえば、走行距離で計算される自動車価格、時間で計算される交通量、企業の成長で計算される市場需要などです。予測対象が時間に依存する場合、回帰は非常に適した選択肢です。 教師なし学習<br /> 教師なし学習は 1990 年代に発明され、「未知の特徴に基づいてターゲットをセグメント化し、機械に最善の方法を選択させる」と説明できます。 教師なし学習 - 次元削減 「特定の機能を高レベルの機能に組み合わせる」 断片化された機能を使用するよりも、抽象的なものを使用する方が常に便利です。たとえば、三角形の耳、長い鼻、大きな尻尾を持つすべての犬を、「牧羊犬」という素敵な抽象的な概念にまとめることができます。 教師なし学習 - 相関ルール学習 「注文フローの特徴的なパターンの分析」 ショッピングカートの分析、マーケティング戦略の自動化など。たとえば、顧客がビール6本パックを持ってレジに近づくとき、その途中にピーナッツを置くべきでしょうか?もしそうなら、これらの顧客はどのくらいの頻度で購入に来るでしょうか?ビールピーナッツが完璧な組み合わせなら、他に何が素晴らしい組み合わせになるでしょうか? 現実の世界では、すべての大手小売業者が独自の専用ソリューションを持っており、最も技術的に進歩したものは「推奨システム」と呼ばれるものです。 バギング法では通常、均質な弱学習者を考慮し、これらの弱学習者を互いに独立して並行して学習し、何らかの決定論的な平均化プロセスに従ってそれらを組み合わせます。すべての弱学習者が決定木モデルであると仮定すると、結果として得られるバギングはランダム フォレストになります。 ブースティング法では通常、均質な弱学習者を考慮しますが、その考え方は「分割統治」です。これらの弱い学習者を高度に適応的な方法で順次学習し、後続の弱いモデルは、前の弱いモデルによって誤分類されたデータの学習に重点を置きます。 現在、ナイーブベイズからブースティング法まで、古典的な機械学習の主な分野はすでに利用可能です。読者がより体系的かつ詳細に理解したい場合、Li Hang 教授の「統計学習法」と Zhou Zhihua 教授の「機械学習」は、中国語のチュートリアルとして最適です。 参考リンク: |
>>: 素人の私でも、機械学習コミュニティのこれらの問題が分かります
人工知能技術の発展に伴い、携帯電話の翻訳ソフトを使って自分の言語をリアルタイムで翻訳したり、画像認識...
米国現地時間の水曜日、人気の短編動画プラットフォーム「TikTok」(Douyinの海外版)のCEO...
[[440499]] Google チームは、CoRL 2021 で暗黙的動作クローニング (Imp...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[421174]]基数ソートコンセプト基数ソートは、整数をビットごとにソートする非比較整数ソート ...
[[311778]] 5G、人工知能、モノのインターネットなどの技術が徐々に成熟するにつれて、スマ...
1. 機械学習の概要 1. 機械学習とは何ですか?機械は大量のデータを分析して学習します。たとえば...