道具としてのベイズ統計のまんまと、自分で咀嚼するために、自分流で書く。 とおもったけど、違う。 Aの確率が0.5, Bの確率が0.5 なら、 同時確率 P(A,B)は 0.25 Aが起こった上でのBの確率は、P(B|A) 0.5 Aが起こる確率を含めて書けば、P(B|A) = P(A) * P(B) で0.25なんだけど、、、 条件付き確率が問題とされるのは、現実として、A,Bの過去の確率が分かっている。 そして、同じタイミングで計測されているので、A,Bの同時確率も分かっている。 自分の人生で、30年生きてきて、赤いトンボが8月に飛んでいたら、冬寒い。 そんなことが、5回あった。2回は違った。ちなみに冬が寒かったのは、10回だった。 表にすると、
となって、合計が合うようするので、
と表が埋まる。 んでもって、 確率(過去の割合だ)になおすと、全部を30でワる。
さて、今年だ。 なんか赤とんぼをみた気がする。今年の冬は寒いだろうか? 表ができたので、赤とんぼと寒かったところに箇所の数字は、、、 0.1666 ではなく、単純に、 過去は、5勝2負だ。 5/7= 0.714くらい。表では、0.16666/0.23333 P(寒かった|赤とんぼ) = P(寒かった , 赤とんぼ) /p(赤とんぼ) (* ","は同時確率を意味。) なんか面白くない結論だ。 まんまじゃないか、、 でも、公式が残る。 P(B|A) = P(B,A)/p(A) で、 P(A|B) = P(B,A)/p(B) なので、 P(B|A)P(A) = P(A|B)P(B) といった式が成り立つ。 同時確率なしに、条件付き確率だけで記述された。 P(B|A) = P(A|B)P(B) / P(A) といった式ができる。 Aが起きたときのBの確率を、 Aが起きる確率 * AとBが同時に起きる確率 とするのではなく、 ここらあたりは、コンテキストで言語表現は違う。 |