マルコフの不等式とチェビシェフの不等式の基礎

公開:
統計 #マルコフの不等式 #チェビシェフの不等式

マルコフの不等式

確率変数 XX について、

P(Xc)E[X]cP(|X| \leq c) \leq \frac{E[|X|]}{c}

が成り立ち、これをマルコフの不等式と呼びます。

証明

XX の値の範囲を条件に持つような 2 種類の定義関数を導入します。

I(Xc)={1  (Xc)0  (X<c)I(|X| \geq c) = \begin{equation*} \begin{cases} 1~~(|X| \geq c) \\\\ 0~~(|X| < c) \\\\ \end{cases} \end{equation*} I(X<c)={1  (X<c)0  (Xc)I(|X| < c) = \begin{equation*} \begin{cases} 1~~(|X| < c) \\\\ 0~~(|X| \geq c) \\\\ \end{cases} \end{equation*}

これらは互いに排他的な関係性にあるため、同時に 11 にはならず

I(Xc)+I(X<c)=1I(|X| \geq c) + I(|X| < c) = 1

の関係式となります。これを用いて

E[X]=E[X(I(Xc)+I(X<c))]E[XI(Xc)]cE[I(Xc)]=cP(Xc)E[X]cP(Xc)\begin{aligned} E[|X|] &= E[|X| \left(I(|X| \geq c) + I(|X| < c) \right)] \\ &\geq E[|X| I(|X| \geq c)] \\ &\geq c \cdot E[I(|X| \geq c)] \\ &= c \cdot P(|X| \geq c) \\ \therefore \frac{E[|X|]}{c} &\geq \cdot P(|X| \geq c) \\ \end{aligned}

チェビシェフの不等式

マルコフの不等式において

X(Xμ)2,  ck2X \to (X-\mu)^2,~~ c \to k^2

の置き換えを行うと、以下の不等式が成り立ちます。

P(Xμk)σ2k2P(|X-\mu| \leq k) \leq \frac{\sigma^2}{k^2}

直感的なイメージ

マルコフの不等式、チェビシェフの不等式の直感的なイメージについて調べてみたいと思います。マルコフの不等式は

P(Xc)E[X]cP(|X| \leq c) \leq \frac{E[|X|]}{c}

であり、左辺は確率変数がある値(しきい値)cc を超える確率を意味していて、その確率に上限をつけることができるというものです。

ある銀行に預けている預金の平均残高が 10 万円だとします。今、預金残高が 100 万円以上の人がどのくらいいるかを知りたいとします。 マルコフの不等式を使うと、次のように計算できます。

P(X100)E[X]100=10100=0.1P(|X| \leq 100) \leq \frac{E[|X|]}{100} = \frac{10}{100} = 0.1

したがって、預金残高が 100 万円以上の人は最大でも 10% しかいないことがわかります。この「最大でも」というのがミソであり、実際はこの街には 100 万円以上の預金を持っている人はゼロかもしれませんし、0.1% はいるかもしれません。具体的な確率はわからないものの、上限値を設定できるというのがマルコフの不等式です[1]

もう少し踏み込んで

先程の例は具体的な数値を用いた計算でしたが、少し抽象化すると次のように理解できます。とある確率分布に従う確率変数 XX に対して、元の確率分布の性質は全くわからないが、期待値 E[X]E[X] だけ分かっているものとします。この場合に、確率変数 XX が期待値の 10 倍の大きさを持つ値となる確率は

P(X10E[X])E[X]10E[X]=0.1P(|X| \leq 10\cdot E[X]) \leq \frac{E[|X|]}{10 \cdot E[X]} = 0.1

となることが分かり、期待値から大きくハズレた値を取る確率は小さくなってくる、という直感的なイメージと合う結論が導けます。


脚注

  1. 従う確率分布が分からないのに、期待値(平均)が計算できるというのは現実的ではないなと思います。実際には標本平均を用いたりと(大数の法則からサンプル数が多い場合には、母平均に確率収束するため)、よりざっくりとした関係式になってくると思います。 ↩︎