マルコフの不等式
確率変数 X について、
P(∣X∣≤c)≤cE[∣X∣]
が成り立ち、これをマルコフの不等式と呼びます。
証明
X の値の範囲を条件に持つような2種類の定義関数を導入します。
I(∣X∣≥c)={1 (∣X∣≥c)0 (∣X∣<c)
I(∣X∣<c)={1 (∣X∣<c)0 (∣X∣≥c)
これらは互いに排他的な関係性にあるため、同時に 1 にはならず
I(∣X∣≥c)+I(∣X∣<c)=1
の関係式となります。これを用いて
E[∣X∣]∴cE[∣X∣]=E[∣X∣(I(∣X∣≥c)+I(∣X∣<c))]≥E[∣X∣I(∣X∣≥c)]≥c⋅E[I(∣X∣≥c)]=c⋅P(∣X∣≥c)≥⋅P(∣X∣≥c)
チェビシェフの不等式
マルコフの不等式において
X→(X−μ)2, c→k2
の置き換えを行うと、以下の不等式が成り立ちます。
P(∣X−μ∣≤k)≤k2σ2
直感的なイメージ
マルコフの不等式、チェビシェフの不等式の直感的なイメージについて調べてみたいと思います。マルコフの不等式は
P(∣X∣≤c)≤cE[∣X∣]
であり、左辺は確率変数がある値(しきい値)c を超える確率を意味していて、その確率に上限をつけることができるというものです。
例
ある銀行に預けている預金の平均残高が10万円だとします。今、預金残高が100万円以上の人がどのくらいいるかを知りたいとします。
マルコフの不等式を使うと、次のように計算できます。
P(∣X∣≤100)≤100E[∣X∣]=10010=0.1
したがって、預金残高が100万円以上の人は最大でも10% しかいないことがわかります。この「最大でも」というのがミソであり、実際はこの街には100万円以上の預金を持っている人はゼロかもしれませんし、0.1% はいるかもしれません。具体的な確率はわからないものの、上限値を設定できるというのがマルコフの不等式です。
もう少し踏み込んで
先程の例は具体的な数値を用いた計算でしたが、少し抽象化すると次のように理解できます。とある確率分布に従う確率変数 X に対して、元の確率分布の性質は全くわからないが、期待値 E[X] だけ分かっているものとします。この場合に、確率変数 X が期待値の10倍の大きさを持つ値となる確率は
P(∣X∣≤10⋅E[X])≤10⋅E[X]E[∣X∣]=0.1
となることが分かり、期待値から大きくハズレた値を取る確率は小さくなってくる、という直感的なイメージと合う結論が導けます。