機械学習モデルの仕組み

機械学習モデルの仕組み

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discovery)から転載したものです。

多くの面接官は、「もし私が5歳児だったら、[ある技術]を説明してください」という質問をしたがります。幼稚園児に機械学習を説明するのは少し大げさかもしれませんが、実際には、この質問の要件は、ある技術をできるだけ簡単に説明することです。

[[324730]]

これが私がこの記事で試みようとしていることです。機械学習とは何か、機械学習の種類について説明し、一般的なモデルを紹介します。この記事では数学的な操作は一切紹介しませんので、初めての方も安心してお読みください。

データ サイエンスの知識がほとんどない、またはまったくない大人でも理解できるはずです (そうでない場合は、コメントでお知らせください)。

機械学習の定義

機械学習グラフ

機械学習では、大量のデータをコンピューター プログラムに読み込み、そのデータに適合するモデルを選択して、コンピューターが(ユーザーの助けを借りずに)予測を行えるようにします。コンピュータがモデルを作成する方法はアルゴリズムによって行われ、その範囲は単純な方程式 (直線の方程式など) から、コンピュータが最善の予測を導き出せるようにする非常に複雑な論理/数学システムまで多岐にわたります。

機械学習は、まさにその名の通りのものです。使用するモデルを選択してそれを調整(つまり、モデルを改善するために調整)すると、マシンはそのモデルを使用してデータ内のパターンを学習します。次に、新しい条件(観察)を入力すると、結果が予測されます。

教師あり機械学習の定義

教師あり学習は、モデルに入力されたデータが「ラベル付け」されるタイプの機械学習です。簡単に言えば、ラベル付けとは、観測値(つまり、データの行)がわかっていることを意味します。

たとえば、友人がゴルフに行くかどうかをモデルで予測しようとする場合、気温や曜日などの変数がある可能性があります。データにラベルが付けられている場合は、友人が実際にゴルフに行ったときに値が 1 になる変数と、ゴルフに行かなかったときに値が 0 になる変数も存在します。

教師なし機械学習の定義

データのラベル付けに関しては、教師なし学習は教師あり学習の正反対です。教師なし学習では、友人がゴルフに行くかどうかはわかりません。モデルを通じてパターンを見つけ、何が起こったかを推測したり、何が起こるかを予測したりするのはコンピューター次第です。

教師あり機械学習モデル

1. ロジスティック回帰

分類の問題がある場合は、ロジスティック回帰を使用できます。これは、ターゲット変数 (予測する必要のある変数) が異なるカテゴリで構成されていることを意味します。これらのカテゴリは、はい/いいえ、または顧客満足度を表す 1 ~ 10 の数字のいずれかになります。

ロジスティック回帰モデルは、方程式を使用してデータを含む曲線を作成し、その曲線を使用して新しい観測結果を予測します。

ロジスティック回帰プロット

上の図では、新しい観測値は曲線の左側にあるため、予測値は 0 になります。この曲線上のデータを見ると、グラフの「予測値 0」領域ではほとんどのデータ ポイントの y 値が 0 になっているため、これが明らかになります。

2. 線形回帰

線形回帰は、一般的に知られている最も初期の機械学習モデルの 1 つです。なぜなら、x 変数を 1 つだけ使用する場合、アルゴリズム (つまり、舞台裏の方程式) は比較的簡単に理解できるからです。小学校で習うように、最もよく合う直線を描くだけです。この最適な線は、新しいデータ ポイントを予測するために使用できます (下の図を参照)。

線形回帰プロット

線形回帰はロジスティック回帰に似ていますが、ターゲット変数が連続している場合に使用できます。つまり、線形回帰は任意の数値で使用できます。実際、連続的なターゲット変数を持つモデルはすべて「回帰」として分類できます。連続変数の例としては、住宅の販売価格が挙げられます。

線形回帰も解釈しやすいです。モデル方程式には各変数の係数が含まれており、これらの係数は独立変数 (x 変数) が変化するたびにターゲット変数がどの程度変化するかを示します。

住宅価格の場合、これは回帰方程式を見て、「家の大きさ (x 変数) が 1 平方フィート増えるごとに、販売価格 (ターゲット変数) が 25 ドル増加することを示しています」と言える可能性があることを意味します。

3. K近傍法(KNN)

このモデルは分類や回帰に使用できます。「K 近傍法」という名前は紛らわしいものではありません。モデルは、すべてのデータをマッピングすることから始まります。 「K」の部分は、モデルが予測値を決定するために使用する最も近いデータ ポイントの数を指します (下の図を参照)。 K を選択し、これらの値を試して、どの値が最良の予測を与えるかを確認できます。

K近傍アルゴリズム図

K = __ 円内のすべてのデータ ポイントは、この新しいデータ ポイントのターゲット変数値に「投票」できます。最も多くの票を獲得した値が、KNN が新しいデータ ポイントに対して予測する値になります。

上の図では、最も近い点のうち 2 つはクラス 1 で、1 つはクラス 2 です。したがって、モデルはこのデータ ポイントに対してクラス 1 を予測します。モデルがクラスではなく数値を予測しようとしている場合、すべての「投票」は予測値を取得するために平均化される数値です。

4. サポートベクターマシン

サポート ベクター マシンは、データ ポイント間に境界を確立することによって動作します。境界では、1 つのクラスの大部分が境界の片側 (2D の場合は線) に配置され、他のクラスの大部分が反対側に配置されます。

サポートベクターマシン図

その仕組みは、機械が最大マージンを持つ境界を見つけようとするというものです。マージンは、各クラスの最も近いポイントと境界の間の距離です。次に、新しいデータ ポイントがプロットされ、境界のどちら側に位置するかに基づいて分類されます。

このモデルの説明は分類に基づいていますが、回帰には SVM を使用することもできます。

5. 決定木とランダムフォレスト

[[324733]]

画像ソース: unsplash

教師なし機械学習モデル

さて、私たちは「深海」に到達し、教師なし学習について見ていきます。念のため言っておきますが、これはデータセットにラベルが付いていないため、観測結果は不明であることを意味します。

1. K平均法クラスタリング

K を使用してクラスタリングを表す場合、まずデータ セットに K 個のクラスターがあると想定する必要があります。データ内に実際にいくつのグループがあるかわからないため、さまざまな K の値を試し、視覚化とメトリックを使用してどの K の値が機能するかを確認する必要があります。 K は、円形および同様のサイズのクラスターに最適であることを意味します。

k-means クラスタリング アルゴリズムは、まず K 個の各クラスターの中心を形成する最適な K 個のデータ ポイントを選択します。次に、各ポイントに対して次の 2 つの手順を繰り返します。

  • データポイントを最も近いクラスターセンターに割り当てる
  • このクラスター内のすべてのデータポイントの平均を取って新しい中心を作成します

K平均法クラスタリンググラフ

2. DBSCAN クラスタリング

DBSCAN クラスタリング モデルは、K の入力値を必要とせず、任意の形状のクラスターを見つけることができるという点で、K 平均法クラスタリングとは異なります。クラスターの数を指定する代わりに、クラスターに必要なデータ ポイントの最小数を入力し、データ ポイントの周囲の半径内でクラスターを検索します。

DBSCAN はクラスターを自動的に検出し、データセットに適したクラスターが得られるまで、モデルの作成に使用される値を変更できます。

さらに、DBSCAN モデルは「ノイズ」ポイント (つまり、他のすべての観測点から遠く離れたポイント) を分類します。データ ポイントが非常に接近している場合、このモデルは K 平均法よりも優れたパフォーマンスを発揮します。

3. ニューラルネットワーク

私の意見では、ニューラル ネットワークは最もクールで神秘的なモデルです。これらは、脳内のニューロンの働きをモデルにしているため、「ニューラル ネットワーク」と呼ばれます。これらのモデルはデータ セット内のパターンを探し、人間が決して認識できないようなパターンを発見することもあります。

ニューラル ネットワークは、画像や音声などの複雑なデータを非常にうまく処理できます。顔認識からテキスト分類まで、これらは私たちが毎日目にするソフトウェアの背後にある論理原理です。

[[324735]]

画像ソース: unsplash

時には混乱することもあり、専門家であってもコンピューターが特定の結論に達した理由を完全に理解できないこともあります。場合によっては、予測が優れているかどうかだけが重要なのです。

しかし、どの求職者が一次面接に進むかを決定するためにモデルを使用している場合など、コンピューターがどのように予測に到達するかが重要な場合もあります。

この記事によって、これらのモデルに対する理解が深まり、その素晴らしさがわかっていただければ幸いです。

<<:  5G時代、移動ロボットは知能でどのように勝利できるのでしょうか?

>>:  携帯電話なら何でもコピー&ペーストできる。このデザイナーはパートタイムでコードを書き、ARを新たなレベルに引き上げた。

推薦する

...

Baidu PaddlePaddle EasyDL リテール版シェルフステッチングサービスのアーキテクチャとアルゴリズムの詳細な説明

日用消費財業界の商品識別需要シナリオでは、日用消費財ブランドの営業担当者は、販売のために端末店舗を訪...

トップレベルの人工知能チームを構築するにはどうすればよいでしょうか?

市場には優れた AI ソフトウェア ツールが数多く存在しますが、プロジェクトを実装する際には強力なチ...

プロセスマイニングを通じて運用の卓越性を達成するための8つのステップ

運用の卓越性は、ビジネスの回復力と収益の成長を向上させる鍵となりますが、今日のプロセス所有者は、急速...

...

...

...

橋梁点検におけるUAV技術の応用

これらの技術の応用により、長期的にはドローンが開発され、橋梁点検の分野で応用されるでしょう。では、橋...

...

視覚的なプロンプトを使用してください。シュム氏は、トレーニングや微調整なしですぐに使用できるIDEAリサーチインスティテュートの新しいモデルを実演します。

視覚的なプロンプトを使用するとどのような感じでしょうか?写真をランダムにフレームに入れるだけで、同じ...

AI、5G、エッジテクノロジーが製造業をリード

オフィスから作業場、製品に至るまで、製造業はテクノロジーで溢れており、コネクテッドエコノミーの導入に...

...

手術ロボットには依然としてリスクがあり、人工知能技術の応用は成熟する必要がある

外科用ロボット、人工知能心理学者、そして一連の「人工知能+」プロジェクト技術の統合が医療分野に急速に...

...

Timsort アルゴリズムと Yutu 月面探査車のバグを見つけるにはどうすればよいでしょうか?

0×00 背景形式手法は、私たちのほとんどにとっては非常に高度なものです。せいぜい授業で聞いたこと...