[51CTO.com からのオリジナル記事] 「靴屋が 3 人いれば、諸葛亮 1 人より優れている」ということわざがあります。複数の弱い立場の人々が知恵を結集する方法があれば、より良い結果が得られます。
実際、アンサンブル学習の考え方は同じです。新しいインスタンスを分類するときに、複数の単一分類器が統合され、複数の分類器の分類結果を何らかの方法で組み合わせて最終的な分類が決定され、単一の分類器よりも優れたパフォーマンスが実現されます。 単一の分類器を意思決定者に例えると、アンサンブル学習法は複数の意思決定者が一緒に意思決定を行うことに相当します。 現在、アンサンブル学習で一般的に使用されているアルゴリズムは、バギング、ブースティング、スタッキングの 3 つです。 バギング アルゴリズム。ブートストラップ集約アルゴリズムとも呼ばれます。バギングはブートストラップと集約を組み合わせて形成された複合モデルであるため、通常はバギングという名前が使用されます。 バギング アルゴリズムは、主にサンプル トレーニング セットに対してランダム サンプリングを実行し、繰り返しサンプリングすることで新しいモデルをトレーニングし、最終的にこれらのモデルに基づいて包括的な予測結果を選択します。 袋詰め バギングに基づく代表的なアルゴリズムにはランダムフォレストがある。 ブースティング アルゴリズムは、一般的に使用されている効果的な統計学習アルゴリズムであり、反復アルゴリズムです。ブースティングとバギングの違いは、重み付けされたデータが弱い分類器を使用して順番にトレーニングされることです。 ブースティングは、弱い学習器を継続的に使用して、以前の弱い学習器の「欠陥」を補うことで、より強い学習器を連続的に構築します。この強い学習器は、目的関数の値を十分に小さくすることができます。 ブースト Boosting シリーズのアルゴリズムの中で最も人気のあるアルゴリズムは、AdaBoost アルゴリズムと GBDT アルゴリズムです。 スタッキング アルゴリズムは、メタ分類器またはメタ回帰器を通じて複数の分類モデルまたは回帰モデルを統合するアンサンブル学習手法です。ベースモデルはトレーニング セット全体をトレーニングに使用し、メタモデルはベースモデルの機能をトレーニングの機能として使用します。 スタッキング 基本モデルには通常、異なる学習アルゴリズムが含まれているため、スタッキングは通常、異種のアンサンブルになります。 数値出力の場合、最も一般的な結合戦略は平均化を使用することです。
ただし、大規模な統合の場合、重みパラメータが多くなり、過剰適合に陥りやすくなります。加重平均法は必ずしも単純平均法よりも優れているわけではありません。 一般的に、学習者ごとの成績が大きく異なる場合には加重平均法を用いるのが適切であり、学習者ごとの成績が同程度である場合には単純平均法を用いるのが適切である。 多数決: 最も多くの票を獲得したマークが予測となります。複数のマークが同時に *** 票を獲得した場合、ランダムに 1 つが選択されます。 予測カテゴリが、任意の予測サンプル x に対して、弱学習器の予測結果がそれぞれであると仮定します。 最も単純な投票方法は相対多数決投票法で、これはよく「少数が多数に従う」と呼ばれるものです。つまり、サンプル X に対する弱学習器の予測結果のうち、最も数字が大きいカテゴリが最終的な分類カテゴリになります。複数のカテゴリーが最も多くの票を獲得した場合、最終カテゴリーとしてランダムに 1 つが選ばれます。 絶対多数決方式: ラベルが過半数の票を獲得した場合、そのラベルの予測が有効になります。そうでない場合、予測は拒否されます。 これは、しばしば多数決と呼ばれる相対多数決方式よりも複雑です。相対多数決方式に基づくと、100% の投票だけでなく、過半数の投票も必要になります。 加重投票法:アルゴリズムはより複雑です。加重平均法と同様に、各弱学習器の分類投票に重みを掛け、最後に各カテゴリの加重投票を合計し、最も高い値に対応するカテゴリが最終カテゴリになります。 トレーニング データが大量にある場合、エラーを最小限に抑えるために、より強力な組み合わせ戦略、つまり「学習法」を使用して、別の学習者を介して組み合わせることができます。 学習方法としては、スタッキングが代表的な方法です。スタッキングの組み合わせ戦略では、弱学習器の結果に対して単純な論理処理を実行するのではなく、もう 1 層の学習器を追加します。つまり、トレーニング セット内の弱学習器の学習結果を入力として、トレーニング セットの出力を出力として使用し、学習器を再トレーニングして最終結果を取得します。 この場合、弱い学習者を一次学習者、組み合わせに使用される学習者を二次学習者と呼びます。テスト セットでは、最初にプライマリ学習器を使用して 1 回予測し、セカンダリ学習器の入力サンプルを取得し、次にセカンダリ学習器を使用してもう一度予測し、最終的な予測結果を取得します。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
<<: 「ブロックチェーン+人工知能」は医療金融やその他の応用シナリオに応用されています
>>: アルゴリズムは偏っているか?他の人よりも優れていればいいのです!
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
10月12日、国家情報セキュリティ標準化技術委員会の公式サイトによると、同委員会が組織し策定した技...
新インフラ政策の導入以来、データセンター、5G、ビッグデータの開発が最も頻繁に言及されていますが、産...
5月21日、新人新市は北京で2021年新人新市ブランドアップグレード記者会見を開催した。今回の記者会...
大規模言語モデル (LLM) のパフォーマンスは驚異的ですが、ユーザーからのリクエストを受け取るたび...
海外メディア(VentureBeat)によると、1980年代後半には、多くのスタートアップ企業、政府...
2020 年のサイバーセキュリティは転換点を迎えています。人工知能と機械学習の進歩はサイバーセキュリ...
[[337240]]人工知能技術は今、世界を変えつつあります。多くの業界はすでに、ビジネス プロセス...
過去 10 年間の AI システムの進歩のスピードは驚くべきものでした。 2016年の囲碁対局でアル...
近年、顔認識技術が急速に発展し、顔をスキャンするだけで高速鉄道駅に入ることができるので非常に便利です...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...