📊 🎲 📞

ポアソン分布をイチから理解する

「めったに起きないこと」の回数を予測する確率分布

🤔 ポアソン分布って何?(ひとことで)

📞
ひとことで言うと
ある一定の時間や空間の中で、「まれな出来事」が何回起きるかを表す確率分布。

例えば:
・1時間にコールセンターに電話が何回かかってくるか
・1日に交差点で事故が何件起きるか
・1ページに誤植が何個あるか
・1時間にWebサイトに何人アクセスするか

共通点:「ある期間に、ランダムに起きるイベントの回数」を数えている。
名前の由来:フランスの数学者 シメオン・ドニ・ポアソン(Siméon Denis Poisson)にちなんで命名。
1837年に発表された。

📞 具体例:コールセンターの電話

あるコールセンターでは、1時間あたり平均3回電話がかかってくるとする。

知りたいこと
「平均3回」はわかっている。でも実際には…
・次の1時間で0回の確率は?
・次の1時間でちょうど3回の確率は?
・次の1時間で5回以上の確率は?

→ これを計算できるのがポアソン分布!

λ(ラムダ)= 3 のときの確率分布

λ(ラムダ)= 一定期間の平均回数。この例では λ = 3(1時間に平均3回)

5.0%
0回
14.9%
1回
22.4%
2回
22.4%
3回
16.8%
4回
10.1%
5回
5.0%
6回
2.2%
7回
0.8%
8回+
★ 黄色 = 平均値(λ=3)のところ

「平均3回」でも、実際は0回〜7回以上まで幅がある!
その各回数の起きやすさを教えてくれるのがポアソン分布。

📖
グラフの読み方
平均3回なので、2〜3回が最も起きやすい(各22.4%)。
0回(電話が全くこない)は5%しかないし、
7回以上は2.2%でかなりまれ。

つまり「平均3回って言われてるけど、実際にはだいたい1〜5回の範囲に収まるんだな」とわかる。

📊 λ(ラムダ)が変わると分布の形はどう変わる?

λ は「平均何回起きるか」を表すパラメータ。
ポアソン分布はλ だけで形が決まる。(パラメータが1つだけ!シンプル!)

λ = 1 のとき(めったに起きない)

例:1日に交差点で事故が起きる回数(平均1回/日)

36.8%
0回
36.8%
1回
18.4%
2回
6.1%
3回
1.5%
4回
0.3%
5回+

λが小さい → 0回に偏った、左に寄った形。右に裾が長い(右に歪んだ形)。

λ = 10 のとき(わりと頻繁に起きる)

例:1時間にWebサイトへのアクセス数(平均10回/時)

0%
0-3
1.9%
4
3.8%
5
6.3%
6
9.0%
7
11.3%
8
12.5%
9
12.5%
10
11.4%
11
9.5%
12
7.3%
13
5.2%
14
3.5%
15+

λが大きい → 左右対称に近い、正規分布に似た形になっていく!

λによる形の変化まとめ:
✅ λが小さい → 左に偏った非対称な形(0回が多い)
✅ λが大きい → 正規分布に近い左右対称な形になっていく
✅ 一般にλ ≧ 20〜30くらいで正規分布でほぼ近似可能

📐 ポアソン分布の式

P(X = k) = e−λ × λk / k!
P(X = k)
k回起きる確率
e−λ
自然対数の底
e ≈ 2.718
λk
λ(平均回数)を
k回かけたもの
k!
kの階乗
3! = 3×2×1 = 6

具体的に計算してみよう

🧮
例:平均3回の電話が、ちょうど5回くる確率は?
λ = 3、k = 5 を代入:

P(X = 5) = e−3 × 35 / 5!
= 0.0498 × 243 / 120
= 0.1008 ≈ 約10.1%

「平均3回なのに5回電話がくる確率は約10%」とわかる。
ポアソン分布の超重要な性質:

平均 = λ
分散 = λ

平均と分散が同じ値になる!これはポアソン分布だけの特徴で、G検定でも頻出。
つまりλが大きいほど平均回数が多くなり、同時にばらつきも大きくなる。

✅ ポアソン分布が使える条件

どんな場面でもポアソン分布が使えるわけではない。
以下の条件が全て満たされるときにポアソン分布が適用できる。

1
イベントが独立に発生する

1回の電話が来たかどうかと、次の電話が来るかどうかは無関係
1回来たからといって次が来やすくなったり来にくくなったりしない。

2
平均発生率(λ)が一定

どの時間帯でも電話の来やすさは同じ
「朝は忙しくて夜は暇」みたいに変動しない。

3
同時に2回以上起きない

非常に短い時間内には最大1回しかイベントが起きない。
(全く同じ瞬間に2本の電話がかかってくることはない)

⚠️
ポアソン分布が使えない例
地震の回数:1回の地震が余震を引き起こすので、独立ではない(条件1に違反)。
通勤電車の乗客数:朝のラッシュと昼では発生率が全然違う(条件2に違反)。

🔗 二項分布との関係

ポアソン分布は実は二項分布の特殊ケース。2つの関係を理解しておくとG検定で強い。

🎯
たとえ話で比較
二項分布:100回くじを引いて(n=100)、当たり確率が5%(p=0.05)のとき、何回当たるか?
→ 試行回数nと確率pがはっきりわかっている。

ポアソン分布:1時間に平均5回(λ=5)電話がくるとき、何回来るか?
→ 「何回くじを引いたか」がわからない。わかるのは平均回数だけ

二項分布 → ポアソン分布への変換

二項分布 B(n, p)
n回の試行で、確率pで成功する回数
n → ∞(非常に大きい)
p → 0(非常に小さい)
np = λ(一定)
ポアソン分布 Po(λ)
平均λ回起きるイベントの回数

「試行回数がめちゃくちゃ多い(n→∞)けど、1回あたりの確率がめちゃくちゃ小さい(p→0)」
→ 二項分布はポアソン分布に近づく。これをポアソンの極限定理と呼ぶ。

💡
具体的にイメージすると
1万人が町を歩いている(n = 10,000)。
1人が1時間以内に転ぶ確率は0.03%(p = 0.0003)。
→ np = 10,000 × 0.0003 = 3人(λ = 3)。

二項分布で計算しても、ポアソン分布(λ=3)で計算しても、
ほぼ同じ結果になる。でもポアソンの方が圧倒的に計算が楽

📊 主要な確率分布との比較

分布何を数える?パラメータ具体例取りうる値
ベルヌーイ分布 1回の試行で
成功か失敗か
p(成功確率) コイン1回投げて
表が出るか
0 or 1
二項分布 n回の試行で
成功する回数
n(試行回数)
p(成功確率)
コイン10回投げて
表が出る回数
0, 1, 2, ... n
ポアソン分布 一定期間に
起きるイベントの回数
λ(平均回数) 1時間に電話が
くる回数
0, 1, 2, ...
正規分布 連続的な値の
分布
μ(平均)
σ²(分散)
テストの点数
身長の分布
−∞ 〜 +∞
(連続値)
覚え方のコツ:

ベルヌーイ:1回だけ → 「やるか、やらないか」
二項分布:n回繰り返す → 「10回やって何回成功?」
ポアソン:回数を数える → 「1時間で何回来る?」(試行回数が不明)
正規分布:連続値 → 「身長は何cmくらい?」

ベルヌーイ → 二項分布(n回に拡張)→ ポアソン(nが∞、pが0に)
ポアソン → 正規分布(λが大きくなると近似)

という繋がりがある!

🏁 全体まとめ

ポアソン分布の全体像

定義

一定の時間・空間の中でまれな出来事が何回起きるかの確率分布

λ
パラメータ

λ(ラムダ)1つだけで分布の形が決まる。λ = 平均回数

最重要ポイント

平均 = λ、分散 = λ(平均と分散が同じ!)

分布の形

λが小さい → 左に偏る / λが大きい → 正規分布に近づく

他の分布との関係

二項分布でn→∞、p→0にするとポアソンに近づく(ポアソンの極限定理)

G検定で問われるポイント:

✅ ポアソン分布は「一定期間に起きるまれなイベントの回数」の分布
✅ パラメータはλ(ラムダ)1つだけ
平均 = λ、分散 = λ(最重要!)
✅ λが大きくなると正規分布に近づく
✅ 二項分布のn→∞、p→0の極限がポアソン分布
✅ 条件:イベントが独立、発生率が一定、同時に2回以上起きない
✅ 取りうる値は0以上の整数(上限なし)
離散型の確率分布(連続値ではなく整数値をとる)