僕の理解に合わせて、頻繁に書き換えてます。 ご了承ください。
事前確率 と 事後確率 の関係を示す。事前確率と事後確率、この矢印の向きは両方ある。
この上のものは、条件付確率。 こういう条件で これが起きた。 その確率。
で、同時確率という概念も当然ある。
一緒におこった。通常は、これで考えるのだが、、、、
事前、事後と、それぞれの個別の確率の関係を ベイズの定理は示してくれる。 P(A|B) = P(B|A)P(A) / P(B)
*同時確率なしで記述できてる。 条件付確率に変換できている(途中式は、いろんな本に載ってる)。
すると上の1,2で、
Aが分かっていれば、Bが分かる。(事前確率が分かれば、事後確率が分かる)
Bが分かっていれば、Aが分かる。(事後確率が分かれば、事前確率が分かる)
もう一度、事後確率、逆確率、原因の確率こういうことが起きたんだけど、、、この原因を、あれだとすると、その確率はどれくらいよ???
という話。
非常に人間の日常的な思考形態に近い、、あれが原因だ、アイツが原因だ! とか、、、、
でも、頭がコンガラカル。
たぶん、どっちが原因で、どっちが結果なのかが、分からなくなるせいだと思ってる。 でも、この事前確率と事後確率は、同じにならない!と考えるのが重要。 面倒くさくなって、同時確率=事前確率=事後確率 と考えてしまいがち、、、間違い。
たとえ話として昨日、アクセス数が10%UPした(5日に一回くらい起こる)んだけど、、、、原因は、、、、
1. ある地域で雨が降っていた(その会社は、遠隔地に居て、その地域が雨だったかどうか知らない)
過去、その地域で雨の降ったときに、アクセスが前日比UPにつながったのは、2/3だったけど、、今回はどうよ? 社員 : 雨が降った日は、2/3で 10%UPだったので、今回も、雨が原因ですよ。でも、起こる(った)確率と、原因の確率は違う。
こういう感じで、推定する。
A: アクセスUP
B: 雨が降る P(A|B) : 雨が降るとアクセスUPする確率 P(B|A) : アクセスUPした原因が 雨な確率 P(A) : アクセスUP確率(ここでは、過去から五日に一回なので、20%) P(B) : 雨確率(とりあえず、10%としてる) P(B|A) = P(A|B)*P(B) / P(A)
= (雨でUPする確率 * 雨が降る確率) / (前日比で、アクセスが10%UPする確率(過去データから))
= (2/3 * 1/10) / (1/5)
上司 : 1/3っぽいな、他の原因を検討しなさい、、、、、、
雨 vs アクセス10%UP の 原因が明らかになるようなら、2/3の確率を変更・調整する。
この本、分かるように書いてくれてる。 Rの学習もいるけど、お勧め。 値段が安ければ最高なのだが、、
|