「めったに起きないこと」の回数を予測する確率分布
あるコールセンターでは、1時間あたり平均3回電話がかかってくるとする。
λ(ラムダ)= 一定期間の平均回数。この例では λ = 3(1時間に平均3回)
「平均3回」でも、実際は0回〜7回以上まで幅がある!
その各回数の起きやすさを教えてくれるのがポアソン分布。
λ は「平均何回起きるか」を表すパラメータ。
ポアソン分布はλ だけで形が決まる。(パラメータが1つだけ!シンプル!)
例:1日に交差点で事故が起きる回数(平均1回/日)
λが小さい → 0回に偏った、左に寄った形。右に裾が長い(右に歪んだ形)。
例:1時間にWebサイトへのアクセス数(平均10回/時)
λが大きい → 左右対称に近い、正規分布に似た形になっていく!
どんな場面でもポアソン分布が使えるわけではない。
以下の条件が全て満たされるときにポアソン分布が適用できる。
1回の電話が来たかどうかと、次の電話が来るかどうかは無関係。
1回来たからといって次が来やすくなったり来にくくなったりしない。
どの時間帯でも電話の来やすさは同じ。
「朝は忙しくて夜は暇」みたいに変動しない。
非常に短い時間内には最大1回しかイベントが起きない。
(全く同じ瞬間に2本の電話がかかってくることはない)
ポアソン分布は実は二項分布の特殊ケース。2つの関係を理解しておくとG検定で強い。
「試行回数がめちゃくちゃ多い(n→∞)けど、1回あたりの確率がめちゃくちゃ小さい(p→0)」
→ 二項分布はポアソン分布に近づく。これをポアソンの極限定理と呼ぶ。
| 分布 | 何を数える? | パラメータ | 具体例 | 取りうる値 |
|---|---|---|---|---|
| ベルヌーイ分布 | 1回の試行で 成功か失敗か |
p(成功確率) | コイン1回投げて 表が出るか |
0 or 1 |
| 二項分布 | n回の試行で 成功する回数 |
n(試行回数) p(成功確率) |
コイン10回投げて 表が出る回数 |
0, 1, 2, ... n |
| ポアソン分布 | 一定期間に 起きるイベントの回数 |
λ(平均回数) | 1時間に電話が くる回数 |
0, 1, 2, ... ∞ |
| 正規分布 | 連続的な値の 分布 |
μ(平均) σ²(分散) |
テストの点数 身長の分布 |
−∞ 〜 +∞ (連続値) |
一定の時間・空間の中でまれな出来事が何回起きるかの確率分布
λ(ラムダ)1つだけで分布の形が決まる。λ = 平均回数
平均 = λ、分散 = λ(平均と分散が同じ!)
λが小さい → 左に偏る / λが大きい → 正規分布に近づく
二項分布でn→∞、p→0にするとポアソンに近づく(ポアソンの極限定理)