とりあえず、ここから理解するのが現実的かと思う。
ビジネス上の分析への応用範囲も広いし。
取りうる結果を、二通りに分解できる場合は、二項分布と考えて処理できる。
Rの利用
期待される成功数を出したいときは、
乱数を使う。
rbinom(サンプリング数, 一回当たりの試行数, 確率) とやる。
0.2%のCV率で、セッション数が一日200回のシミュレーション。
> rbinom(100,200,0.002) [1] 0 0 1 0 1 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0 [38] 0 0 0 0 0 2 1 1 0 1 1 1 0 1 0 1 0 2 1 1 1 0 0 0 1 1 1 1 0 1 0 0 1 1 1 1 0 [75] 2 0 0 0 0 0 0 0 1 0 1 0 2 0 1 3 0 0 0 0 0 1 1 1 0 0 苦悩の日々が続く、、、
個別の成功数が、どれくらい確率になるのかを出したい場合は、
確立密度関数を使う。
dbinom(成功数, 試行回数, 確率) とやる。
> dbinom(c(0:5),200,0.002) [1] 6.700516e-01 2.685578e-01 5.355009e-02 7.082778e-03 6.990517e-04 [6] 5.491549e-05 みやすく、パーセントにして、少数を削ると、
> round((dbinom(c(0:5),200,0.002))*100) [1] 67 27 5 1 0 0
一定以上の成功数の確率を出したい場合は、
累積確率分布関数を使う。
pbinom(成功数の上限, 試行回数, 確率) とやる。
> pbinom(0, 1400, 0.002)
[1] 0.0606398
一日200セッションで、CV率が0.2%で一週間のCV数が、一回もない確率は、、
6%くらいはある。年に3,4週くらいはあってもおかしくない。
ちなみに、個別の足し上げ = 累積なので、
確率密度関数のSUMと、累積確率密度関数の値は同じになる。
> sum(dbinom(c(0:4), 1400, 0.002))
[1] 0.8478633
> pbinom(4, 1400, 0.002)
[1] 0.8478633
0, 25, 50,75, 100%までの確率別に成功数を見る場合には、
クォンタイル関数を使う。
qbinom(
二項分布は、binom。
乱数はrandomのr, 確率密度関数はdistributionのd, 累積確率密度関数はprobabilityのp、確率ラインを4分割にして、その確率までの成功数を見るには、クォンタイル関数 quantileのqを使う。
を頭に入れておくと、忘れない。 |
R関連 >