【機械学習を図解で解説】誰でもわかるアルゴリズムの原理

【機械学習を図解で解説】誰でもわかるアルゴリズムの原理

アルゴリズムの式はかなり面倒で、機械学習は苦痛すぎる。機械学習を初めて学ぶ人は、複雑な数式やわかりにくい用語に圧倒されるかもしれません。しかし、実は、わかりやすい図があれば、機械学習の原理を理解するのは非常に簡単になります。この記事ではブログ投稿の内容を整理し、読者はこれらの図に基づいて一見高度な機械学習アルゴリズムを理解できるようにします。

機械学習の話題は誰もが話題にするほど普及していますが、それを完全に理解している人はほとんどいません。インターネット上の機械学習に関する記事の中には、理解しにくいものや理論的すぎるもの、あるいは人工知能、データサイエンス、将来の仕事の魔法についての漠然とした紹介でいっぱいのものなどがあります。

そこで、この記事の著者である vas3k は、簡潔な言葉とわかりやすい図解を使用して、読者が機械学習を理解しやすくしています。この記事では、難解な理論的導入を捨て、機械学習における実際的な問題、効果的な解決策、わかりやすい理論に焦点を当てています。プログラマーでもマネージャーでも、この記事はあなたのためのものです。

AIの範囲

AIにはどのような分野が含まれており、さまざまな技術用語とどのような関係があるのでしょうか。実際、私たちにはさまざまな判断方法があり、AI のカテゴリの区分は一意ではありません。たとえば、最も「一般的な」理解は、次の図のようになるかもしれません。

あなたはこう思うかもしれません:

  • 人工知能は生物学や化学と同様に、包括的な知識の分野です。
  • 機械学習は人工知能の非常に重要な部分ですが、唯一の部分ではありません。
  • ニューラル ネットワークは、現在非常に人気のある機械学習の一種ですが、他にも優れたアルゴリズムは存在します。

しかし、ディープラーニングはニューラルネットワークに関するものなのでしょうか?もちろん、必ずしもそうとは限りません。たとえば、周志華教授の Deep Forest は、微分不可能なコンポーネントに基づく最初のディープラーニング モデルです。したがって、より科学的な区分は次のようになります。

機械学習の下には表現学習があり、これは機械学習を使用して表現自体をマイニングするすべての方法をまとめたものです。データ機能を手動で設計する必要がある従来の ML と比較して、このタイプの方法では、有用なデータ機能を自ら学習できます。ディープラーニング全体も一種の表現学習であり、レイヤーごとのモデルを通じて単純な表現から複雑な表現を構築します。

機械学習ロードマップ

面倒な場合は、完全な技術ロードマップを参照してください。

現在の主流の分類によれば、機械学習は主に次の 4 つのカテゴリに分類されます。

  • 古典的な機械学習;
  • 強化学習;
  • ニューラルネットワークとディープラーニング。
  • アンサンブル法;

古典的な機械学習

従来の機械学習は、多くの場合、教師あり学習と教師なし学習の 2 つのカテゴリに分けられます。

教師あり学習

分類では、モデルには常にメンター、つまり対応する特徴の注釈が必要であり、これによりマシンはこれらの注釈に基づいてさらに分類することを学習できます。すべてを分類することができ、ユーザーを興味に基づいて分類したり、記事を言語と主題に基づいて分類したり、音楽をジャンルに基づいて分類したり、電子メールをキーワードに基づいて分類したりできます。

スパムフィルタリングでは、ナイーブベイズアルゴリズムが広く使用されてきました。実際、ナイーブベイズはかつて最もエレガントで実用的なアルゴリズムであると考えられていました。

サポート ベクター マシン (SVM) は、最も人気のある古典的な分類方法です。また、写真や文書内の植物の外観など、存在するすべてのものを分類するためにも使用されます。サポート ベクター マシンの背後にある考え方も非常にシンプルです。次の図を例に挙げてみましょう。データ ポイント間のマージンが最大となる 2 本の線を描画しようとします。

教師あり学習 - 回帰

回帰は基本的に分類ですが、予測されるターゲットはカテゴリではなく数値です。たとえば、走行距離で計算される自動車価格、時間で計算される交通量、企業の成長で計算される市場需要などです。予測対象が時間に依存する場合、回帰は非常に適した選択肢です。

教師なし学習

教師なし学習は 1990 年代に発明され、「未知の特徴に基づいてターゲットをセグメント化し、機械に最善の方法を選択させる」と説明できます。

教師なし学習 - クラスタリング

クラスタリングは、事前定義されたクラスを使用しない分類の一種です。持っている靴下の色をすべて覚えていないときに、色ごとに分類するようなものです。クラスタリング アルゴリズムは、特定の特性に基づいて類似のオブジェクトを見つけ、それらを 1 つのクラスターにマージしようとします。

教師なし学習 - 次元削減

「特定の機能を高レベルの機能に組み合わせる」

断片化された機能を使用するよりも、抽象的なものを使用する方が常に便利です。たとえば、三角形の耳、長い鼻、大きな尻尾を持つすべての犬を、「牧羊犬」という素敵な抽象的な概念にまとめることができます。

たとえば、テクノロジーに関する記事には専門用語が多く含まれ、政治ニュースには政治家の名前が最も多く含まれています。これらの特徴的な単語や冠詞を新しい特徴に組み合わせて、それらの潜在的な関連性を維持したい場合、SVD は良い選択です。

教師なし学習 - 相関ルール学習

「注文フローの特徴的なパターンの分析」

ショッピングカートの分析、マーケティング戦略の自動化など。たとえば、顧客がビール6本パックを持ってレジに近づくとき、その途中にピーナッツを置くべきでしょうか?もしそうなら、これらの顧客はどのくらいの頻度で購入に来るでしょうか?ビールピーナッツが完璧な組み合わせなら、他に何が素晴らしい組み合わせになるでしょうか?

現実の世界では、すべての大手小売業者が独自の専用ソリューションを持っており、最も技術的に進歩したものは「推奨システム」と呼ばれるものです。

アンサンブル法

「団結は力なり」という古い格言は、機械学習の分野における「アンサンブル法」の基本的な考え方をよく表現しています。アンサンブル法では、通常、複数の「弱いモデル」をトレーニングして、それらを組み合わせて強力な方法にすることを期待します。さまざまな古典的な ML コンテストでは、勾配ブースティング ツリーやランダム フォレストなどの最高の結果のほとんどは、アンサンブル手法です。

一般的に言えば、統合方法の「組み合わせ方法」は、スタッキング、バギング、ブースティングの 3 つの主要なタイプに分けられます。

下の図に示すように、スタッキングでは通常、異種の弱学習者を考慮します。弱学習者は最初に並列でトレーニングされ、その後「メタモデル」を介して結合され、異なる弱モデルの予測結果に基づいて最終的な予測結果が出力されます。

バギング法では通常、均質な弱学習者を考慮し、これらの弱学習者を互いに独立して並行して学習し、何らかの決定論的な平均化プロセスに従ってそれらを組み合わせます。すべての弱学習者が決定木モデルであると仮定すると、結果として得られるバギングはランダム フォレストになります。

ブースティング法では通常、均質な弱学習者を考慮しますが、その考え方は「分割統治」です。これらの弱い学習者を高度に適応的な方法で順次学習し、後続の弱いモデルは、前の弱いモデルによって誤分類されたデータの学習に重点を置きます。

これは、データの一部に焦点を当てたさまざまな弱い分類器を使用して「分割統治」の効果を達成することと同じです。以下に示すように、ブースティングは異なるモデルを直列に組み合わせるパラダイムです。 XGBoost や LightGBM などの有名なライブラリやアルゴリズムはすべて、ブースティング方式を使用しています。

現在、ナイーブベイズからブースティング法まで、古典的な機械学習の主な分野はすでに利用可能です。読者がより体系的かつ詳細に理解したい場合、Li Hang 教授の「統計学習法」と Zhou Zhihua 教授の「機械学習」は、中国語のチュートリアルとして最適です。

もちろん、このブログでは、強化学習やディープラーニングなども紹介されており、人工知能に興味はあるが関連分野を専攻していない読者に非常に適した内容となっています。生き生きとしたイラストと相まって、非常に優れた科学普及記事と言えるでしょう。このシンプルでわかりやすい物語スタイルにご興味がおありの方は、ブログで詳しくお読みいただけます。

<<:  GitHub のスター数は 10 万近くに達しています。インド人男性がすべての AI アルゴリズムを Python と Java で実装しました。

>>:  遠隔医療市場は2020年に65%近く成長すると予測

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

クアルコム:米国は自動運転技術の標準化で中国に遅れをとる可能性

[[272354]]画像: この Uber の自動運転車は、米国サンフランシスコでテスト中に信号待ち...

ストーリーを伝えれば、動画が編集されます。AI による動画編集の自動化により、パンダの目を持つ編集者が解放されます。

ビデオ編集は、編集者が適切なフレームを見つけてつなぎ合わせる必要がある、時間と労力を要する作業です。...

...

150億のパラメータを持つ、史上最大のビジュアルモデル「V-MoE」の全コードをGoogleがオープンソース化

昨年 6 月に Google Brain チームが発表した 43 ページの論文「Scaling Vi...

Ruan Yifeng: ガウスぼかしアルゴリズム

通常、画像処理ソフトウェアには、画像にぼかし効果を加えるための「ぼかし」フィルターが用意されています...

Baidu AIは素晴らしいキャンパスライフに新たなタッチを加え、新学期をより技術的に

幼少期、小学校、中学校、高校、大学に至るまで、キャンパスライフはほとんどの人にとって欠かせないもので...

英国で今年、自動運転車が合法化される

[[397045]]画像ソース: https://pixabay.com/images/id-358...

iCubヒューマノイドロボットは目を動かしたり、話したり、人を抱きしめたりすることができ、今回は遠隔操作も可能だ

2011 年には、子供のような iCub ヒューマノイド ロボットについて耳にしていました。これは次...

NumPy から直接 RNN を作成するにはどうすればいいですか?

成熟した Tensorflow および PyTorch フレームワークを使用して再帰ニューラル ネッ...

...

製造業で「ロボット」が増加中

1997年、IBMが開発したディープ・ブルーがロシアのチェス名人ガルリ・カスパロフに勝利し、人工知能...

ディープラーニングコンパイラについて知っておくべきこと

[[409589]]ディープラーニングはここ 10 年ほどで急速に発展し、業界では多くのディープラー...

...

北京航空航天大学はモードの壁を打ち破り、可視光と赤外線モードにわたる普遍的な物理的対抗手段を開発しました。

近年、視覚システムのセキュリティ評価の研究が徐々に深まっています。研究者は、メガネ、ステッカー、衣服...