【51CTO.comオリジナル記事】 序文機械学習は人工知能の分野で重要な部分を占めています。簡単に言えば、コンピューター プログラムがデータを学習し、それに応じた推奨事項や決定を生成するプロセスです。 機械学習の典型的な定義は次のとおりです。
この記事では、画像とテキストを使用して、機械学習の概念的原理と開発プロセスを詳しく理解できるようにします。この記事は次のように構成されています。
1. 機械学習入門機械学習とは、コンピュータがデータ分布に基づいて確率的な統計モデルを構築し、そのモデルを使用してデータを分析および予測する方法です。データ分布を学習する方法の違いにより、主に教師あり学習と教師なし学習に分けられます。 1. 教師あり学習:これは、選択されたモデルと決定された学習戦略を通じて、ラベル付けされたデータ (x は可変特徴空間、y はラベル) から最適なモデルを学習し、適切なアルゴリズムを使用してモデルを計算し、予測に使用するプロセスです。 モデル予測結果Yの値が有限か無限大かによって、分類モデルか回帰モデルに分けることができます。 2. 教師なし学習:選択されたモデルと決定された学習戦略を通じて、ラベルなしデータ(x は可変特徴空間)から最適なモデルを学習し、適切なアルゴリズムを使用して計算し、モデルを使用してデータの統計法則や内部構造を発見することです。 応用シナリオに応じて、クラスタリング、次元削減、関連分析などのモデルに分けられます。 2. 機械学習の開発プロセス1. ビジネス上の問題を特定するビジネス上の問題を明確にすることは、機械学習の前提条件です。ここでは、実際のビジネス上の問題に対するソリューションを抽象化する必要があります。つまり、どのようなデータを学習する必要があるか (入力)、そして、どのようなモデルを意思決定に必要とするか (出力) です。 (例えば、既存のSinaニュースとそのカテゴリラベルデータを学習して分類モデルを取得し、そのモデルを使用して毎日の新着ニュースのカテゴリ予測を行い、各ニュースチャンネルに分類します。) 2. データの選択:データの収集と入力データによって機械学習の結果の上限が決まり、アルゴリズムはこの上限にできるだけ近づくだけです。 つまり、データの品質がモデルの最終的な効果を決定するということです。実際の産業アプリケーションでは、アルゴリズムが占める割合は通常非常に小さく、エンジニアの仕事のほとんどは、データの検索、データの精製、データの分析です。データの選択では次の点に重点を置く必要があります。 ① データは代表的なものでなければなりません。そうでないと、モデルが過剰適合してしまい、トレーニング データ以外の新しいデータを認識できなくなります。 ②教師あり学習業務が時間に関係する場合、データの時間枠が明確である必要があり、そうでないと、データ漏洩、つまり因果関係が逆転した特徴の存在と利用につながる可能性があります。 (例えば、明日雨が降るかどうかを予測するが、トレーニングデータには明日または今週の気温と湿度の条件が紹介されている) 3. 特徴エンジニアリング: データの前処理と特徴抽出特徴エンジニアリングとは、生データをモデルにとって有用な特徴に変換することです。技術的な手段には、特徴表現、欠損値/外れ値の処理、データの離散化、データの標準化、特徴抽出などがあります。
① フィルタリング方法:各特徴をその相違または相関指標に従ってスコア化し、分散検証、相関係数、カイ二乗検定、情報ゲインなどを選択します。 ②パッケージング方法:毎回いくつかの特徴量を選択するか、いくつかの特徴量を除外し、モデル予測効果スコアに基づいて特徴量を選択します。 ③埋め込み法:特定のモデルをトレーニングに使用して各特徴の重み係数を取得し、XGBOOST特徴重要度出力など、重み係数が大きいものから小さいものまで順に特徴を選択します。 特徴次元削減: 特徴選択後の特徴数がまだ多すぎる場合、データサンプルがまばらになったり、距離計算が困難になったりするなどの問題 (「次元の呪い」と呼ばれる) が発生することがよくありますが、これは特徴次元削減によって解決できます。 一般的に使用される次元削減法には、主成分分析(PCA)、 線形判別分析(LDA)など 4. モデルのトレーニングモデルトレーニングは、モデルが学習するデータの分布を選択するプロセスです。このプロセスでは、結果を改善するために、トレーニング結果に基づいてアルゴリズムの (ハイパー) パラメータを調整する必要もあります。
モデルの選択は、データの状況と予測の目標によって異なります。複数のモデルをトレーニングし、実際の結果に基づいてパフォーマンスの優れたモデルまたはモデル融合を選択できます。
5. モデル評価モデル学習の目的は、学習したモデルが新しいデータに対して優れた予測能力(一般化能力)を持つようにすることです。 モデル評価基準: モデルは、与えられた損失関数のモデルトレーニング誤差とテスト誤差に基づいて評価されます。実際には、モデルの一般化能力は通常、テスト誤差によって評価されます。
6. 意思決定機械学習の最終的な目標は意思決定であり、モデルの予測情報を分析・解釈し、実際の作業領域に適用することです。 エンジニアリングは結果指向であることに留意する必要があります。オンラインで実行されるモデルの影響は、モデルの成功または失敗を直接決定します。これには、モデルの精度、エラーなどだけでなく、実行速度(時間計算量)、リソース消費(空間計算量)、および安定性の総合的な考慮も含まれます。
参考文献データマイニングのプログラマー向けガイド 機械学習 - 周志華 統計的学習法 - 李航 Google 機械学習 著者:Dabai 氏はアルゴリズム開発において長年の経験があり、自然言語処理、銀行および金融リスク管理、ナレッジグラフなどの分野に精通しています。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
>>: ナノロボットは本当に伝説通り魔法の力を持つのでしょうか?
[[385470]]ビッグデータダイジェスト制作出典: Wired編纂者:周熙Uber EatsやU...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
BERT や GPT などの事前トレーニング済みのトランスフォーマーの登場により、言語モデリングは近...
前回の記事「自動運転車に「道路を認識」させる方法」では、主に自動運転車における高精度地図の重要性につ...
[51CTO.com クイック翻訳] エッジ AI は、人工知能の分野で注目を集めている新しい分野...
[[210898]]なぜ人々が人工知能にこれほど魅了されるのか分からないなら、69歳のGoogle研...
[[197626]]人工知能は新しい用語ではなく、その開発の歴史は数十年にわたります。それは 19...
分布の不一致を避けるために、強化学習のトレーニングはオンラインで環境と対話する必要がありますか? G...
ご存知のとおり、大規模言語モデル (LLM) の動作ロジックでは、サイズが大きくなるにつれて言語生成...
AI アシスタントの将来について語るとき、アイアンマン シリーズに登場する魅力的な AI アシスタン...