R関連‎ > ‎

二項分布

とりあえず、ここから理解するのが現実的かと思う。
ビジネス上の分析への応用範囲も広いし。

取りうる結果を、二通りに分解できる場合は、二項分布と考えて処理できる。
  • コインなら裏表だし、
  • サイコロなら "1" と それ以外とか、
  • アクセス集計なら、コンバージョンしたか、どうか。
  • 野球なら、ヒットになった、ならない。
  • サッカーなら、枠に飛んだ、飛ばない。

Rの利用

期待される成功数を出したいときは、

乱数を使う。
rbinom(サンプリング数, 一回当たりの試行数, 確率) とやる。
0.2%のCV率で、セッション数が一日200回のシミュレーション。
> rbinom(100,200,0.002)
  [1] 0 0 1 0 1 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 0 0
 [38] 0 0 0 0 0 2 1 1 0 1 1 1 0 1 0 1 0 2 1 1 1 0 0 0 1 1 1 1 0 1 0 0 1 1 1 1 0
 [75] 2 0 0 0 0 0 0 0 1 0 1 0 2 0 1 3 0 0 0 0 0 1 1 1 0 0
苦悩の日々が続く、、、




個別の成功数が、どれくらい確率になるのかを出したい場合は、

確立密度関数を使う。
dbinom(成功数,  試行回数, 確率) とやる。
> dbinom(c(0:5),200,0.002)
[1] 6.700516e-01 2.685578e-01 5.355009e-02 7.082778e-03 6.990517e-04
[6] 5.491549e-05

みやすく、パーセントにして、少数を削ると、
> round((dbinom(c(0:5),200,0.002))*100)
[1] 67 27  5  1  0  0
0回が67%, 1が27%,,,,,



一定以上の成功数の確率を出したい場合は、
累積確率分布関数を使う。
pbinom(成功数の上限, 試行回数, 確率) とやる。
> pbinom(0, 1400, 0.002)
[1] 0.0606398
一日200セッションで、CV率が0.2%で一週間のCV数が、一回もない確率は、、
6%くらいはある。年に3,4週くらいはあってもおかしくない。

ちなみに、個別の足し上げ = 累積なので、
確率密度関数のSUMと、累積確率密度関数の値は同じになる。
> sum(dbinom(c(0:4), 1400, 0.002))
[1] 0.8478633

> pbinom(4, 1400, 0.002)
[1] 0.8478633

0, 25, 50,75, 100%までの確率別に成功数を見る場合には、
クォンタイル関数を使う。
qbinom(

二項分布は、binom。 
乱数はrandomのr, 確率密度関数はdistributionのd, 累積確率密度関数はprobabilityのp、確率ラインを4分割にして、その確率までの成功数を見るには、クォンタイル関数 quantileのqを使う。
を頭に入れておくと、忘れない。


【ポイント10倍】【包装無料】野田琺瑯 コンフィデンス ソースパン14cm ホワイト CF-14N-...
Comments