サポートベクターマシン (SVM)
サポート ベクター マシンとは何ですか? サポート ベクター マシンは、データの分類分析を実行できる教師あり機械学習モデルです。実際、サポート ベクター マシン アルゴリズムは、インスタンスを分離できる優れた超平面を見つけるプロセスです。 上記のようにデータが線形に分離可能な場合は、線形分類器を使用して 2 つのクラスを分離できます。データが非線形に分離可能な場合はどうすればよいでしょうか? 次のようになります: ご覧のとおり、異なるクラスのデータ ポイントは分離可能ですが、単純に直線を描いて分類することはできません。 では、サポート ベクター マシンを使用して非線形機械学習データセットを適合させるにはどうすればよいでしょうか? SVMの実験機械学習データセットの作成 まず、非線形機械学習データセットを作成します。 Python コードは次のとおりです。
線形サポートベクターマシンを使ってみる まず、次のように Python で実装できる線形サポート ベクター マシンの使用を試みます。
C は誤分類に関連するコストです。 C 値が高いほど、データ セットを正しく分離するアルゴリズムが厳格になります。線形分類器の場合は、kernel='linear' を使用します。 ご覧のとおり、コストを高く設定したにもかかわらず、線は赤い点と青い点をうまく分離していません。 ラジアル基底関数カーネル これまで使用した線形分類器は次のとおりです。 ご覧のとおり、g(x) は線形関数です。 g(x) > 0 の場合、予測値は 1 になります。 g(x) <0の場合、予測値は-1になります。しかし、上記のような非線形データを処理するために線形関数を使用することはできないため、線形関数を別の関数に変換する必要があります。 この分類器は、非線形データに最適であると思われます。 Python コードを見てみましょう:
ガンマは1/シグマです。覚えておいてください、シグマは調整機能です。したがって、ガンマ値が小さいほど、シグマ値が大きく、分類器はポイント間の距離に対して敏感ではなくなります。 ガンマを上げて何が起こるか見てみましょう。
ガンマを 100 倍に増やすと、トレーニング セットの分類子の精度が向上するようです。ガンマ値を 10 倍するとどうなるでしょうか?
これは、ガンマを 10000 に増やすと、より正確になるという意味ですか? 実際、ガンマ値が大きすぎると、分類器は最終的に違いを認識できなくなります。 Cを増やしましょう。 C は、機械学習データセット全体の誤分類に関連するコストです。つまり、C を増やすと、単一のデータ ポイントだけでなく、データ セット全体の感度が高まります。
SVM 分類器が 2 つのポイント グループを正常に分離できるようにするためのパラメータを見つけました。 やっとこの記事を読んで、SVM 分類器とは何か、そしてそれを非線形機械学習データセットの学習にどのように使用するかについて直感的に理解していただけたと思います。データが高次元の場合、視覚化を通じて分類器のパフォーマンスを判断することはできません。良い方法は、トレーニング セットでトレーニングし、テスト セットで混同行列や f1 スコアなどのメトリックを使用することです。 |
<<: 新型コロナウイルス感染症の流行中に音声テクノロジーが再び注目を集めているのはなぜでしょうか?
>>: 私の国は、5G、人工知能、自動運転で目覚ましい成果を上げ、革新的な国の仲間入りを果たしました。
次のような疑問を持ったことはありませんか?人工知能は非常に人気があります。従来のプログラマーとして、...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
/* 世界を変えるために生きるここでは、あらゆる作品が市場に参入するための種となる可能性があります...
サム・アルトマンは、将来の AI テクノロジーが人類に利益をもたらすためには、大規模言語モデルのマル...
見たものを何でもコピーします。これは魔法ですか、それとも孫悟空の魔力ですか?どちらでもない。これが ...
世界を見渡すと、各国の社会進歩、産業グレードアップ、国防建設などにおける科学技術の価値がますます明ら...
それは1998年、オーストラリアF1グランプリの時のことでした。 36周目にフィンランド人ドライバー...
ネットワークは常に企業の神経系であり、ビジネス プロセスとトランザクションはネットワークを通じてのみ...
[[409544]] 2021年5月初旬、イスラエルに住むパレスチナ人とイスラエル警察の間で激しい衝...
製造業における人工知能がデジタル変革を推進製造業における人工知能はデジタル変革を可能にし、より効果的...
「この二つの技は同じ名前だが、技の内容は大きく異なる。一つは全真剣術の強力な技で、もう一つは玉女剣...
私たちは長年にわたり、機械学習プロジェクトで何が機能し、何が機能しないかを特定するために、さまざまな...
植物保護ドローンは、現在の農業分野において間違いなく新たな人気機器です。高効率、利便性、精度、環境保...