同時確率と条件付き確率

道具としてのベイズ統計のまんまと、自分で咀嚼するために、自分流で書く。

同時確率も、条件付き確率も、結局、両方起こる確率なんだから、いっしょじゃないか???
とおもったけど、違う。

Aの確率が0.5, Bの確率が0.5 なら、
同時確率 P(A,B)は 0.25
Aが起こった上でのBの確率は、P(B|A) 0.5
Aが起こる確率を含めて書けば、P(B|A) = P(A) * P(B) で0.25なんだけど、、、

条件付き確率が問題とされるのは、現実として、A,Bの過去の確率が分かっている。
そして、同じタイミングで計測されているので、A,Bの同時確率も分かっている。

自分の人生で、30年生きてきて、赤いトンボが8月に飛んでいたら、冬寒い。
そんなことが、5回あった。2回は違った。ちなみに冬が寒かったのは、10回だった。

表にすると、

  寒かった そうでも 
 赤とんぼ 5 2 7
 なし   
  10  30(年)

となって、合計が合うようするので、

  寒かった そうでも 
 赤とんぼ 5 2 7
 なし 5 18 23
  10 20 30

と表が埋まる。

んでもって、
確率(過去の割合だ)になおすと、全部を30でワる。

  寒かった そうでも 
 赤とんぼ 0.16666 0.0666 0.2333
 なし 0.16666 0.6 0.7666
  0.3333 0.666 1

さて、今年だ。
なんか赤とんぼをみた気がする。今年の冬は寒いだろうか?
表ができたので、赤とんぼと寒かったところに箇所の数字は、、、
0.1666

ではなく、単純に、
過去は、5勝2負だ。
5/7= 0.714くらい。表では、0.16666/0.23333

P(寒かった|赤とんぼ) = P(寒かった ,  赤とんぼ) /p(赤とんぼ)
(* ","は同時確率を意味。)

なんか面白くない結論だ。
まんまじゃないか、、


でも、公式が残る。

P(B|A) = P(B,A)/p(A)

で、
P(A|B) = P(B,A)/p(B)
なので、

P(B|A)P(A) =  P(A|B)P(B)
といった式が成り立つ。

同時確率なしに、条件付き確率だけで記述された。

P(B|A) = P(A|B)P(B) / P(A)
といった式ができる。

Aが起きたときのBの確率を、
 Aが起きる確率 * AとBが同時に起きる確率
とするのではなく、

ここらあたりは、コンテキストで言語表現は違う。






Comments