ガンマ分布に関する周辺知識をまとめておきます。
ガンマ関数
正の実数 $a$ に対してガンマ関数は以下で定義されます。
$$ \Gamma(a) = \int_{0}^\infty x^{a-1}e^{-x} dx $$
ガンマ関数は階乗計算の一般化になっていて、$n$ を正整数とすれば
$$ \Gamma(n) = (n-1)! $$
という漸化式が成り立ちます。
ガンマ分布
ガンマ分布は
$$ G(\alpha, \beta) = \frac{1}{\Gamma(\alpha)\beta^\alpha} x^{\alpha-1}e^{-x/\beta} $$
で表され、$\alpha$ を形状母数、$\beta$ を尺度母数と呼びます 1
ガンマ分布は正の連続値を取る確率変数が従う分布であるため、そのような性質を持つデータに対してのモデリングに使用されます。以下のようなものが代表的です。
- 人の体重分布
- 降水量の分布
- 電子部品の寿命
分布の形
以下は尺度母数を 2 に固定して、形状母数を 1, 5, 10 と変化させてみたときのガンマ分布の概観です。ガンマ分布の期待値が
$$ E[X] = \alpha\beta $$
であることを踏まえると、ふんわりとピークの位置がそれぞれ $\alpha \times \beta$ の値付近(2, 10, 20)であることも確認できます。
カイ二乗分布
カイ二乗分布はガンマ分布の特殊な場合として表すことができます。自由度 $n$ のカイ二乗分布が従う確率密度関数は以下で表されます。
$$ f(x) = G(n/2, 2) = \frac{1}{\Gamma(n/2)2^{n/2}} x^{n/2-1}e^{-x/2} $$
定義
カイ二乗分布の定義を確認しておきます。$X_1, …, X_n \sim N(0,1), i.i.d.$ の確率変数に対して
$$ Y = X_1^2 + … + X_n^2 $$
と置くとき、$Y$ が従う確率分布が自由度 $n$ のカイ二乗分布です。$\chi^2(n)$ と表されたりします。積率母関数を用いると、$Y$ が $G(n/2, 2)$ に従うことを示せます。
参考書によって定義はまちまちなので気をつけてください。手元の「自然科学の統計学」「現代数理統計学」「現代数理統計学の基礎」「パターン認識と機械学習(上)」では全て定義が異なっていました。 ↩︎