マルコフの不等式

確率変数 XX について、 P(Xc)E[X]c P(|X| \leq c) \leq \frac{E[|X|]}{c} が成り立ち、これをマルコフの不等式と呼びます。

証明

XX の値の範囲を条件に持つような2種類の定義関数を導入します。 I(Xc)={1  (Xc)0  (X<c) I(|X| \geq c) = \begin{equation*} \begin{cases} 1~~(|X| \geq c) \\ 0~~(|X| < c) \\ \end{cases} \end{equation*} I(X<c)={1  (X<c)0  (Xc) I(|X| < c) = \begin{equation*} \begin{cases} 1~~(|X| < c) \\ 0~~(|X| \geq c) \\ \end{cases} \end{equation*} これらは互いに排他的な関係性にあるため、同時に 11 にはならず I(Xc)+I(X<c)=1 I(|X| \geq c) + I(|X| < c) = 1 の関係式となります。これを用いて E[X]=E[X(I(Xc)+I(X<c))]E[XI(Xc)]cE[I(Xc)]=cP(Xc)E[X]cP(Xc) \begin{aligned} E[|X|] &= E[|X| \left(I(|X| \geq c) + I(|X| < c) \right)] \\ &\geq E[|X| I(|X| \geq c)] \\ &\geq c \cdot E[I(|X| \geq c)] \\ &= c \cdot P(|X| \geq c) \\ \therefore \frac{E[|X|]}{c} &\geq \cdot P(|X| \geq c) \\ \end{aligned}

チェビシェフの不等式

マルコフの不等式において X(Xμ)2,  ck2 X \to (X-\mu)^2,~~ c \to k^2 の置き換えを行うと、以下の不等式が成り立ちます。 P(Xμk)σ2k2 P(|X-\mu| \leq k) \leq \frac{\sigma^2}{k^2}

直感的なイメージ

マルコフの不等式、チェビシェフの不等式の直感的なイメージについて調べてみたいと思います。マルコフの不等式は P(Xc)E[X]c P(|X| \leq c) \leq \frac{E[|X|]}{c} であり、左辺は確率変数がある値(しきい値)cc を超える確率を意味していて、その確率に上限をつけることができるというものです。

ある銀行に預けている預金の平均残高が10万円だとします。今、預金残高が100万円以上の人がどのくらいいるかを知りたいとします。 マルコフの不等式を使うと、次のように計算できます。 P(X100)E[X]100=10100=0.1 P(|X| \leq 100) \leq \frac{E[|X|]}{100} = \frac{10}{100} = 0.1 したがって、預金残高が100万円以上の人は最大でも10% しかいないことがわかります。この「最大でも」というのがミソであり、実際はこの街には100万円以上の預金を持っている人はゼロかもしれませんし、0.1% はいるかもしれません。具体的な確率はわからないものの、上限値を設定できるというのがマルコフの不等式です1

もう少し踏み込んで

先程の例は具体的な数値を用いた計算でしたが、少し抽象化すると次のように理解できます。とある確率分布に従う確率変数 XX に対して、元の確率分布の性質は全くわからないが、期待値 E[X]E[X] だけ分かっているものとします。この場合に、確率変数 XX が期待値の10倍の大きさを持つ値となる確率は P(X10E[X])E[X]10E[X]=0.1 P(|X| \leq 10\cdot E[X]) \leq \frac{E[|X|]}{10 \cdot E[X]} = 0.1 となることが分かり、期待値から大きくハズレた値を取る確率は小さくなってくる、という直感的なイメージと合う結論が導けます。


  1. 従う確率分布が分からないのに、期待値(平均)が計算できるというのは現実的ではないなと思います。実際には標本平均を用いたりと(大数の法則からサンプル数が多い場合には、母平均に確率収束するため)、よりざっくりとした関係式になってくると思います。 ↩︎

#統計