ベルヌーイ / 二項 / ポアソン / 正規 / t分布 / カイ二乗分布
棒が2本だけ!これ以上シンプルな分布はない。
10回投げて成功確率30%のとき、成功回数ごとの確率
★ 最も起きやすいのは np = 10×0.3 = 3回(=平均値)のあたり
二項分布と形は似ているが、上限がないのがポイント(理論上は∞まで)
| ベルヌーイ | 二項分布 | ポアソン | |
|---|---|---|---|
| 試行回数 | 1回 | n回(既知) | 不明(∞とみなす) |
| パラメータ | p | n, p | λ |
| 取りうる値 | 0 or 1 | 0〜n | 0〜∞ |
| 平均 | p | np | λ |
| 分散 | p(1−p) | np(1−p) | λ(平均と同じ!) |
| 具体例 | コイン1回 | 10問テスト | 1時間の電話回数 |
| 関係 | 二項の n=1版 |
ベルヌーイの n回拡張 |
二項の n→∞, p→0 |
t分布は正規分布より山が低く、裾が厚い(極端な値が出やすい)
標準正規分布に従う独立な変数をk個、それぞれ二乗して足すと → 自由度kのカイ二乗分布になる
2つの変数に関連があるか?
例:「性別」と「商品の購入」に
関係があるか?
→ クロス集計表を使って検定
実際のデータが期待した分布に
合っているか?
例:サイコロの各目は
均等に出ているか?
| t分布 | カイ二乗分布(χ²) | |
|---|---|---|
| 何から 作られる? |
標準正規分布を カイ二乗分布で割る |
標準正規分布を 二乗して足す |
| 形 | 左右対称の釣鐘型 (正規分布に似るが裾が厚い) |
左に偏った非対称形 (dfが大きいと対称に近づく) |
| 取りうる値 | −∞ 〜 +∞ | 0 〜 +∞(負にならない) |
| パラメータ | 自由度 df | 自由度 k |
| df大きい ときの極限 |
→ 正規分布に一致 | → 正規分布に近づく |
| 何を測る? | 平均値の差 「この差は偶然か?」 |
分布のズレ 「期待と実際は合ってるか?」 |
| 代表的な 使い方 |
t検定 平均値の差の検定 |
χ²検定 独立性の検定 適合度検定 |
| 分布 | 型 | パラメータ | 平均 | 分散 | 特徴・用途 |
|---|---|---|---|---|---|
| ベルヌーイ | 離散 | p | p | p(1−p) | 1回だけ、0か1か |
| 二項 | 離散 | n, p | np | np(1−p) | n回中何回成功? |
| ポアソン | 離散 | λ | λ | λ | まれなイベントの回数。平均=分散 |
| 正規 | 連続 | μ, σ² | μ | σ² | 釣鐘型。全ての基本。68-95-99.7 |
| t分布 | 連続 | df | 0 (df>1) | df/(df−2) (df>2) |
正規の裾厚版。t検定。df→∞で正規 |
| カイ二乗 | 連続 | k | k | 2k | 二乗の合計。χ²検定。0以上のみ |