AI 初心者必読 | パラメーターとハイパーパラメーターの違いがまだよくわかりませんか?

AI 初心者必読 | パラメーターとハイパーパラメーターの違いがまだよくわかりませんか?

[[244078]]

コンピュータサイエンスには多くの用語があり、それらの多くは一貫して使用されていません。同じ用語であっても、異なる分野の人々はそれを異なる方法で理解します。

たとえば、 「モデル パラメーター」と「モデル ハイパーパラメーター」です。

初心者にとって、明確な定義のないこれらの用語は確かに混乱を招く可能性があります。特に統計学や経済学の分野から来た人にとっては。

これらの用語を詳しく見てみましょう。

モデルパラメータとは何ですか?

モデル パラメーターは、データから値を推定できるモデル内の構成変数です。

  • モデルは予測を行うためにそれらを必要とします。
  • それらの値によって、使用できるモデルが定義されます。
  • それらはデータから推定または学習されます。
  • 通常、プログラマーが手動で設定することはありません。
  • これらは通常、学習モデルの一部として保存されます。

パラメータは機械学習アルゴリズムの鍵となります。これらは通常、過去のトレーニング データから要約されます。

従来の機械学習の文献では、モデルは仮説であり、パラメーターは特定のデータセットに合わせた仮定であると考えることができます。

最適化アルゴリズムは、モデルパラメータを推定するための効果的なツールです。

  • 統計: 統計では、ガウス分布などの変数の分布を想定できます。ガウス分布の 2 つのパラメータは、平均 (μ) と標準偏差 (シグマ) です。これは機械学習に適しており、これらのパラメータをデータから推定し、予測モデルの一部として使用することができます。
  • プログラミング: プログラミングでは、関数にパラメータを渡すことができます。この場合、引数は関数パラメータであり、値の範囲の 1 つを持つことができます。機械学習では、使用する特定のモデルは、新しいデータに対して予測を行うためにパラメータを必要とする関数です。

モデルのパラメータの数が固定か可変かによって、そのモデルが「パラメトリック」か「非パラメトリック」かが決まります。

モデル パラメータの例には次のものがあります。

  • ニューラル ネットワーク内の重み。
  • サポート ベクター マシン内のサポート ベクター。
  • 線形回帰またはロジスティック回帰における係数。

モデルのハイパーパラメータとは何ですか?

モデルのハイパーパラメータは、データから値を推定できないモデルの外部の構成です。

  • これらは、モデル パラメータの推定によく使用されます。
  • 通常は手動で割り当てられます。
  • 通常はヒューリスティック設定を使用できます。
  • これらは多くの場合、特定の予測モデリングの問題に合わせて調整されます。

特定の問題に対するモデルのハイパーパラメータの最適値を知ることはできませんが、経験則を使用したり、他の問題で値を複製したり、試行錯誤を通じて最適値を探したりすることはできます。

機械学習アルゴリズムを特定の問題に合わせて調整すると (たとえば、グリッド検索やランダム検索を使用する場合)、モデルのハイパーパラメータまたはシーケンスが調整され、最も優れたモデル予測につながるパラメータが検出されます。

  • 「多くのモデルには、データから直接推定できない重要なパラメータがあります。たとえば、K 近傍分類モデルでは、適切な値を計算するために使用できる解析式がないため、このようなタイプのモデル パラメータはチューニング パラメータと呼ばれます。」

- 64-65 ページ、応用予測モデリング、2013 年

モデルハイパーパラメータがモデルパラメータと呼ばれた場合、多くの混乱が生じることになります。この混乱を克服するための経験則は次のとおりです。

モデル パラメータを手動で指定する必要がある場合、それはおそらくモデル ハイパーパラメータです。

モデルのハイパーパラメータの例には次のものがあります。

  • ニューラル ネットワークをトレーニングするための学習率。
  • サポート ベクター マシンの C および sigma ハイパーパラメータ。
  • K 個の最も近い近傍。

要約すると、モデルパラメータはデータから自動的に推定されます。ただし、モデルのハイパーパラメータは手動で設定され、プロセス内でモデルパラメータの推定に使用されます。

モデルのハイパーパラメータは、手動で設定および調整する必要がある機械学習の一部であるため、パラメータと呼ばれることがよくあります。

<<:  機械学習は将来どこに向かうのでしょうか?インテル・南京大学共同研究センターが答えを提供する

>>:  詩人のような機械学習: ML の仕組みについての素晴らしい啓示

ブログ    
ブログ    

推薦する

選択できるアルゴリズムが多すぎますか?適切な機械学習アルゴリズムを選択する方法

機械学習は科学であると同時に芸術でもあります。さまざまな機械学習アルゴリズムを見ると、普遍的な解決策...

OpenAIの画像検出ツールが公開され、CTO: AI生成画像の99%を認識可能

OpenAI は AI 画像認識を開始しようとしています。最新のニュースとしては、同社が検出ツールを...

マスク氏がウルトラマンの七つの大罪を明かす!アルトマンが交渉を再開、ChatGPTは崩壊

ChatGPTが再びダウンしました。半月前の大規模な障害に続いて、ChatGPT はアクセスの急増に...

機械学習が通信業界にもたらすメリット

通信分野における機械学習技術は、ネットワーク事業者がサービス品質を向上させ、利益を増やし、顧客離れを...

コカ・コーラの新たな試み:アートや広告制作における生成AIの活用

生成型 AI の新たな波に直面して、私たちはそれに積極的に適応するか、AI (または AI を受け入...

人間や魚を認識するAIは人魚も認識できるのか? Alibaba CVPR 論文における因果推論法の回答

[[399013]]人間と魚の写真で訓練された AI は、初めて人魚の写真を見たときにどのように反応...

技術楽観論者と悲観論者がシリコンバレーでAIの危険性を議論

ChatGPTの立ち上げから1年以上が経った今、2023年のAIに関する最大の話題は、技術そのもので...

...

2022 年のインテリジェント コネクテッド ビークルの技術トレンド トップ 10

100TOPS以上の性能を持つ車載グレードのコンピューティングチップが2022年に量産され、車両に...

表の数学的推論の正解率は98.78%です! UCLA が新しい「カメレオン推論フレームワーク」を発表

自然言語処理タスクで目覚ましい成功を収めた大規模言語モデル (LLM) は、優れたパフォーマンスを示...

ASP.NET データ暗号化を実現する対称暗号化アルゴリズム

対称暗号化アルゴリズムはどのようにして ASP.NET データ暗号化を実装するのでしょうか?それでは...

ディープラーニング: シンプルだが限界のあるソリューション

ディープラーニング:幾何学的視点ディープラーニングに関する最も驚くべき事実は、それがいかにシンプルで...

AI仮想読書機、ジェスチャー認識+OCR+音声TTS

こんにちは、みんな。最近はAIGCのコンテンツを研究しており、公式アカウントのコンテンツを長い間更新...

AI プロジェクトの 85% が失敗する理由は何ですか?

現在、人工知能(AI)は、人事、サプライチェーン、マルチレベルマーケティングなど、さまざまな分野で広...