ディープラーニングで知っておくべき13の確率分布

ディープラーニングで知っておくべき13の確率分布

[[313005]]

機械学習の実践者として、確率分布について知っておく必要があります。ここでは、主に Python ライブラリを使用したディープラーニングに関連する、最も一般的な基本的な確率分布に関するチュートリアルを紹介します。

確率分布の概要

  • 共役とは共役分布関係があることを意味します。

ベイズ確率論では、事後分布 p(θx) と事前確率分布 p(θ) が同じ確率分布族に属する場合、事前分布と事後分布は共役分布と呼ばれ、事前分布は尤度関数の共役事前分布と呼ばれます。共役事前情報については、Wikipedia をご覧ください (https://en.wikipedia.org/wiki/Conjugate_prior)。

  • 多重分類とは、ランダム分散が 2 より大きいことを意味します。
  • n 回は事前確率 p(x) も考慮することを意味します。
  • 確率についてさらに詳しく知りたい場合は、[パターン認識と機械学習、Bishop 2006]を読むことをお勧めします。

分布確率と特性

1. 均一分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py

一様分布は、[a, b]上で同じ確率値を持ち、単純な確率分布です。


2. ベルヌーイ分布(離散)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py

  • 事前確率p(x)はベルヌーイ分布を考慮していません。したがって、最大尤度を最適化すると、簡単に過剰適合する可能性があります。
  • バイナリクロスエントロピーを使用したバイナリ分類。これはベルヌーイ分布の負の対数と同じ形式になります。

3. 二項分布(離散)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py

  • パラメータ n と p を持つ二項分布は、一連の n 回の独立した実験における成功数の離散確率分布です。
  • 二項分布は、事前に取り出す数量を指定して事前確率を考慮した分布です。

4. マルチベルヌーイ分布、カテゴリ分布(離散)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py

  • マルチベルヌーイはカテゴリ分布と呼ばれます。
  • クロスエントロピーは、負の対数としてとられた多重ベルヌーイ分布と同じ形式になります。

5. 多項分布(離散)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py

ベルヌーイ分布が二項分布と関連しているのと同じように、多項分布はカテゴリ分布と関連しています。

6. ベータ分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py

  • ベータ分布は二項分布およびベルヌーイ分布と共役です。
  • 共役を使用すると、既知の事前分布を使用して事後分布を取得することが容易になります。
  • 一様分布は、特殊なケース (α=1、β=1) を満たす場合、ベータ分布と同一になります。

7. ディリクレ分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py

  • ディリクレ分布は多項分布と共役です。
  • k=2 の場合、ベータ分布になります。

8. ガンマ分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py

  • gamma(a, 1)/gamma(a, 1)+gamma(b, 1) が beta(a, b) と同じであれば、ガンマ分布はベータ分布です。
  • 指数分布とカイ二乗分布はガンマ分布の特殊なケースです。

9. 指数分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py

指数分布は、α が 1 の場合のガンマ分布の特殊なケースです。


10. ガウス分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py

ガウス分布は非常に一般的な連続確率分布です。

11. 正規分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py

正規分布は、平均が 0、標準偏差が 1 の標準ガウス分布です。

12. カイ二乗分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py

  • 自由度 k のカイ二乗分布は、k 個の独立した標準正規乱数変数の二乗の合計の分布です。
  • カイ二乗分布はベータ分布の特殊なケースである。

13.t分布(連続)

コード: https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py

t 分布は対称的なベル型の分布で、正規分布に似ていますが、裾が重く、平均値よりはるかに低い値を生成する可能性が高くなります。

<<:  AIはどのようにして顧客の性格を判断できるのでしょうか?

>>:  機械学習に関する12の現実世界の真実

ブログ    
ブログ    
ブログ    

推薦する

ChatGPTでマルウェアを分析する方法

翻訳者 |陳俊レビュー | Chonglouデジタル時代に入って以来、マルウェアはコンピュータ アプ...

...

2021年の人工知能トレンドに関する5つの予測

人工知能は人々の生活を変える可能性を秘めた分野です。ヘルスケア、ビジネス、金融、その他の分野での応用...

GNN初心者必読! Google Research が、SOTA グラフ ニューラル ネットワークをゼロから構築する方法を教えます

[[422426]]近年、ニューラル ネットワークは自然言語、画像、音声、その他のデータで大きな進歩...

大型模型のレイアウトは何度も変わります!

ChatGPT の Android バージョンが登場します。 OpenAI は今年 5 月に早くも...

...

91.3%の成長、「スマート」な製造業の実現は協働ロボットにかかっている

中国は、インダストリー4.0の提案と国家インテリジェント製造2025開発計画の公布により、製造大国か...

鍵となるのは人工知能コンピューティングセンターを構築し、それを活用することだ

デジタル経済の発展に伴い、全国の各省市がコンピューティングインフラの構築を競って推進し、人工知能コン...

...

人工知能の急速な発展により、私たちは職を失うことになるのでしょうか?

音声制御システムから今日のいくつかの無人技術まで、人工知能は徐々に成熟しています。ビッグデータセンタ...

人工知能は人間の文化を継承するが、人間の偏見も受け継いでいる

テクノロジーは既存の人間文化の延長です。テクノロジーは人類の知恵を広げた一方で、人々の偏見や差別も受...

生成的敵対ネットワーク (GAN) の未解決の 7 つの謎

いくつかの指標によれば、生成的敵対的ネットワーク (GAN) の研究は過去 2 年間で大きな進歩を遂...

世界中のもう一人の自分と話すのはどんな感じでしょうか?世界初のAI人間観察者が誕生

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ニューラルコンピュータAIモデルのブレークスルー!トレーニング時間は1秒あたり120万フレームに達し、新記録を樹立

[[326502]]今週、IBMは、同社のニューラル・コンピュータ・システムが1秒あたり120万フレ...

LLM幻覚問題の徹底レビュー! HITチームの50ページのレビューが公開された

幻覚だよ、古い友人よ。 LLM が私たちの視野に入って以来、錯覚の問題は常に無数の開発者を悩ませてき...