機械学習技術におけるアンサンブル学習とは何ですか?

機械学習技術におけるアンサンブル学習とは何ですか?

[51CTO.com クイック翻訳] アンサンブル学習は強力な機械学習技術の 1 つです。アンサンブル学習は、複数の機械学習モデルを使用することで、予測結果の信頼性と精度を向上させます。しかし、複数の機械学習モデルを使用すると、予測の精度がどのように向上するのでしょうか? アンサンブル学習モデルを作成するには、どのような手法を使用できますか? この記事では、これらの質問に対する答えを探り、アンサンブル モデルを使用する基本原則と、アンサンブル モデルを作成するための主な方法を検討します。

アンサンブル学習とは何ですか?

簡単に言えば、アンサンブル学習とは、複数の機械学習モデルをトレーニングし、その出力を組み合わせるプロセスです。組織はさまざまなモデルに基づいて最適な予測モデルの構築に取り組んでいます。さまざまな機械学習モデルを組み合わせることで、モデル全体の安定性が向上し、より正確な予測結果を得ることができます。アンサンブル学習モデルは個々のモデルよりも信頼性が高い場合が多く、そのため多くの機械学習の競争で勝利を収めています。

エンジニアはさまざまな手法を使用してアンサンブル学習モデルを作成できます。単純なアンサンブル学習手法は、さまざまなモデルの出力を平均化することで構成されますが、多くの基本学習者/モデルの予測を組み合わせることに特化した、より洗練された方法とアルゴリズムが開発されています。

アンサンブルトレーニングを使用する理由は何ですか?

機械学習モデルは、さまざまな理由により互いに異なる場合があります。異なる機械学習モデルは、母集団データの異なるサンプルに対して動作し、異なるモデリング手法を使用し、異なる仮定を行う可能性があります。

さまざまな専門家で構成されるチームに参加すると、他のメンバーと技術的なトピックについて話し合っていると仮定すると、知っている技術と知らない技術が必ずあるはずです。彼らもあなたと同じで、自分の専門分野しか知らず、他の専門スキルについては何も知りません。しかし、これらの技術的な知識を最終的に組み合わせることができれば、より多くの領域についてより正確な推測が可能になります。これが、異なる個々のモデル(チームメンバー)の予測を組み合わせて精度を向上させ、エラーを最小限に抑えるというアンサンブル学習の原理です。

統計学者は、ある質問に対して、一連の可能な回答を使って正解を推測するように人々のグループに依頼すると、その回答すべてが確率分布を形成することを明らかにしました。実際に正解を知っている人は自信を持って正解を選びますが、間違った答えを選ぶ人は、考えられる間違った答えの範囲全体に推測を広げます。たとえば、推測ゲームで、あなたと 2 人の友人が正解が A だと知っている場合、3 人とも A を選択し、チームの答えを知らない他の 3 人は B、C、D、または E と誤って推測する可能性が高く、結果として A に 3 票が投じられ、他の答えには 1 票か 2 票しか投じられません。

すべてのモデルにはある程度の誤差があります。前述の理由によりモデル自体が異なるため、あるモデルから発生するエラーは別のモデルによって発生するエラーとは異なります。すべてのエラーを調査すると、エラーは 1 つの回答に集中しているのではなく、広範囲に分散していることがわかります。誤った推測は、基本的にすべての可能性のある誤った回答に分散され、互いに打ち消されます。同時に、さまざまなモデルからの正しい推測が正しい答えの周りに集まります。アンサンブルトレーニング法を使用すると、より確実に正解を見つけることができます。

シンプルなアンサンブルトレーニング法

単純なアンサンブル トレーニング方法では、多くの場合、一連の予測のモード、平均、加重平均を決定するなどの統計的アンサンブル手法の適用のみが含まれます。

パターンとは、数字のセットの中で最も頻繁に出現する要素です。このモデルを取得するには、学習した個々のモデルが予測を返し、それが最終予測への投票としてみなされます。予測の平均は、予測の算術平均(最も近い整数に丸められる)を計算することによって決定されます。最後に、予測を作成するために使用されたモデルに異なる重みを割り当てることによって加重平均を計算できます。ここで、重みはそのモデルの予測の重要性を表します。クラス予測の数値表現に重み (0 ~ 1.0) を掛け、個々の重み付け予測を合計して、結果を最も近い整数に丸めます。

高度なアンサンブルトレーニング方法

主な高レベルのアンサンブル トレーニング手法は 3 つあり、それぞれ特定の種類の機械学習問題を解決するように設計されています。 「バギング」という手法は、モデルの予測の分散、つまり同じ観測に基づく予測のばらつきを減らすために使用されます。ブースティング技術を使用してモデルからバイアスを除去します。最後に、スタッキングは予測結果を改善するためによく使用されます。

アンサンブル学習法は、一般的に、順次アンサンブル法と並列アンサンブル法の 2 つのカテゴリに分けられます。

シーケンシャル アンサンブル メソッドは、基本学習者/モデルが順番に生成されるため、「シーケンシャル」と名付けられています。シーケンシャル アンサンブル法の場合、基本的な考え方は、ベース学習者間の依存関係を活用して、より正確な予測を得ることです。誤ってラベル付けされた例は重みが調整され、正しくラベル付けされた例は重みがそのまま維持されます。新しい学習者が生成されるたびに重みが変化し、その精度が向上します。

順次アンサンブル モデルとは対照的に、並列アンサンブル メソッドは並列にベース学習器を生成します。並列アンサンブル学習を行う場合、各学習者の予測を平均化することで全体的なエラー率を削減できるため、ベース学習者の独立性を活用できます。

アンサンブル トレーニング方法は、同種または異種のいずれかになります。ほとんどのアンサンブル学習方法は均質であり、つまり、単一のタイプの基本学習モデル/アルゴリズムを使用します。対照的に、異種アンサンブルは、異なる学習アルゴリズムを使用して学習者を多様化し、可能な限り最高の精度を保証します。

アンサンブル学習アルゴリズムの例

統合された強化された視覚化

シーケンシャル アンサンブル メソッドの例には、AdaBoost、XGBoost、勾配ツリー ブースティングなどがあります。これらはすべてブーストモデルです。これらの強化モデルの目標は、パフォーマンスが低い弱い学習者を高機能の学習者に変えることです。 AdaBoost や XGBoost などのモデルは、ランダムな推測よりもわずかに優れたパフォーマンスを発揮する多くの弱い学習器から始まります。トレーニングが続くと、データに重みが適用され、調整されます。トレーニングの初期段階で学習者によって誤分類されたインスタンスには、より大きな重みが付けられます。このプロセスを必要な数のトレーニング ラウンドで繰り返した後、予測は加重合計 (回帰タスクの場合) と加重投票 (分類タスクの場合) によって結合されます。

バギング学習プロセス

並列アンサンブル モデルの例としてはランダム フォレスト分類器があり、ランダム フォレストはバギング手法の例でもあります。 「バギング」という用語は「ガイド付き集約」に由来します。サンプルは、「ブートストラップ サンプリング」と呼ばれるサンプリング手法を使用して全体のデータ セットから抽出され、ベース学習者はこれらの手法を使用して予測を行います。分類タスクの場合、基本モデルの出力は投票を使用して集計され、回帰タスクの場合は平均化されます。ランダム フォレストは、個々の決定木を基本学習者として使用し、アンサンブル内の各決定木はデータセットからの異なるサンプルを使用して構築されます。特徴のランダムなサブセットも決定木の生成に使用されます。その結果、高度にランダム化された個々の決定木が生成され、それらすべてが組み合わさって信頼性の高い予測が提供されます。

積み重ねられた統合可視化

スタッキング アンサンブル手法では、複数の回帰モデルまたは分類モデルが、より高レベルのメタモデルを通じて結合されます。下位レベルの基本モデルは、データセット全体を入力してトレーニングされます。ベースモデルの出力は、メタモデルをトレーニングするための機能として使用されます。スタックされたアンサンブル モデルは通常、本質的に異質です。

元の記事のタイトル: アンサンブル学習とは何か?、著者: ダニエル・ネルソン

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  百度が銀川市で初のインテリジェントネットワーク試験ライセンスを獲得し、自動運転車が銀川市の公道でデビューした。

>>:  研究者たちは、スマートデバイスがAIを使って声の発信元を判断できるようにする準備を進めている。

ブログ    
ブログ    

推薦する

AIロボットが大規模に導入されると、私たちはより良くなるのでしょうか?

人工知能の波が大きな変化を引き起こすには、4年という時間は十分あります。 2016年に北京の大学の講...

OpenAI、開発者向けGPTチャットボットAPIのメジャーアップデートを発表、価格を値下げ

6月14日、OpenAIは大規模言語モデルAPI(GPT-4およびgpt-3.5-turboを含む)...

...

BingチャットAIの品質に問題があるとユーザーが報告、マイクロソフトはエクスペリエンスの改善を約束

ここ数週間、ユーザーは Microsoft Edge に組み込まれている GPT-4 AI チャット...

アリババのナレッジグラフが初めて公開: 1日あたり数千万のブロックデータ、数十億の完全インテリジェント監査

アリババのナレッジグラフの助けにより、アリババの電子商取引プラットフォームの管理と制御は、以前の「巡...

アリババ人工知能ラボ:テクノロジーがあなたの生活をどう変えるかを見てみましょう

[PConline News] ジャカルタアジア競技大会が閉幕し、アジア競技大会は正式に杭州タイムに...

Googleは視覚障害者の走行を支援するAIシステムをテストしている

[[353439]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

Analysys OLAP アルゴリズム コンペティションの結果が発表され、オープン ソース グループのダーク ホースがその腕前を披露しました。

100日間以上にわたる激しい競争では、国内トップクラスのテクノロジー企業40社以上が競い合い、競争...

ドーパミンが来る! Google が新しい強化学習フレームワーク Dopamine を発表

Google は、TensorFlow をベースとし、柔軟性、安定性、再現性、高速ベンチマークを提供...

決定木からランダムフォレストへ: ツリーベースアルゴリズムの原理と実装

この記事では、決定木の数学的詳細(およびさまざまな Python の例)とその長所と短所について説明...

機械学習はデータに依存する

[[186928]]ビッグデータ、分析、モノのインターネット、クラウドテクノロジー...近年、これら...

...

生成 AI は現在の DevOps および SRE 作業システムをどのようにサポートしますか?

こんにちは、ルガです。今日は、人工知能エコシステムの中核技術である「生成型人工知能」を意味する GA...