ベイズ推定

僕の理解に合わせて、頻繁に書き換えてます。 ご了承ください。

事前確率 と 事後確率 の関係を示す。

事前確率と事後確率、この矢印の向きは両方ある。
  1. A : 事前の起こった → B:事後に起こった。(通常の流れ)
  2. B : 事後に起きたものが → A:事前の確率(原因の確率)。 これを逆確率と言ってる。
この上のものは、条件付確率。 こういう条件で これが起きた。 その確率。

で、同時確率という概念も当然ある。
一緒におこった。通常は、これで考えるのだが、、、、

事前、事後と、それぞれの個別の確率の関係を ベイズの定理は示してくれる。
P(A|B) = P(B|A)P(A) / P(B)
*同時確率なしで記述できてる。
条件付確率に変換できている(途中式は、いろんな本に載ってる)。

すると上の1,2で、
Aが分かっていれば、Bが分かる。(事前確率が分かれば、事後確率が分かる)
Bが分かっていれば、Aが分かる。(事後確率が分かれば、事前確率が分かる)

もう一度、事後確率、逆確率、原因の確率

事後確率ってのは、くどいけど、、、(逆確率かな、、、)
こういうことが起きたんだけど、、、この原因を、あれだとすると、その確率はどれくらいよ???
という話。
非常に人間の日常的な思考形態に近い、、あれが原因だ、アイツが原因だ! とか、、、、

でも、頭がコンガラカル。
たぶん、どっちが原因で、どっちが結果なのかが、分からなくなるせいだと思ってる。
でも、この事前確率と事後確率は、同じにならない!と考えるのが重要。

面倒くさくなって、同時確率=事前確率=事後確率 と考えてしまいがち、、、間違い。


たとえ話として

昨日、アクセス数が10%UPした(5日に一回くらい起こる)んだけど、、、、原因は、、、、

1.  雨が降っている。10日に一回、雨が降るとして、1/10の確率で起こる)
1. ある地域で雨が降っていた(その会社は、遠隔地に居て、その地域が雨だったかどうか知らない)

過去、その地域で雨の降ったときに、アクセスが前日比UPにつながったのは、2/3だったけど、、今回はどうよ?

社員 : 雨が降った日は、2/3で 10%UPだったので、今回も、雨が原因ですよ。

でも、起こる(った)確率と、原因の確率は違う。

こういう感じで、推定する。
A: アクセスUP
B: 雨が降る

P(A|B) : 雨が降るとアクセスUPする確率
P(B|A) : アクセスUPした原因が 雨な確率
P(A) : アクセスUP確率(ここでは、過去から五日に一回なので、20%)
P(B) : 雨確率(とりあえず、10%としてる)

P(B|A) = P(A|B)*P(B) / P(A)
               = (雨でUPする確率 * 雨が降る確率) / (前日比で、アクセスが10%UPする確率(過去データから))
               =  (2/3 * 1/10) /  (1/5)

上司 : 1/3っぽいな、他の原因を検討しなさい、、、、、、

雨 vs アクセス10%UP の 原因が明らかになるようなら、2/3の確率を変更・調整する。


この本、分かるように書いてくれてる。 Rの学習もいるけど、お勧め。 値段が安ければ最高なのだが、、
豊田 秀樹¥ 3,570
すばらしい。
おすすめです
プログラミング:388位 (2010.07.24)
といいつつ、下の本を読んで、いろいろ書き換えた。読むならコッチが先
涌井 良幸¥ 2,520
そんなに悪くないですよ
初心者向けベイズ統計のテキスト
デフォルメされたベイズ
経営学・キャリア・MBA:1475位 (2010.07.26)
Comments