LEVEL I

さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】



LEVEL I

■ さまざまな確率分布 (probability distributions)

 観測される現象の多くは確率的に変動する事象です.その観測されたデータを説明する統計モデルに,どの確率分布を使えばうまく説明できるでしょうか.
 正規分布や二項分布など,確率分布の種類は数多く,いろいろなカタチ(分布形)があります.確率分布の当てはめを考えるには,そのカタチ(分布形)を知ることが重要です.各確率分布の母数(パラメータ)によってそのカタチ(分布形)が決まります.確率変数には離散型と連続型があり,その範囲もさまざまです.
 このページは,代表的な確率分布について,それらを比較・検討しやすいように母数(パラメータ)やグラフ等を一覧表にまとめたものです.


1. 離散型確率分布 (Discrete probability distributions)

 確率変数のとる値が有限個,あるいは無限個であっても自然数で番号が付けられる場合は「離散型」といいます.

確率分布の名称 母数
(パラメータ)
確率変数X
その範囲(区間)
単峰形 単調形 その他の
分布形
分布形(グラフ)の一例
対称 歪み 減少 増加
二項分布 試行回数,
成功率
X :成功数,
0 ≦ X ≦ 試行回数

[X の乱数]





binomial
ポアソン分布 発生回数の平均 X :発生回数,
0 ≦ X

[X の乱数]





poisson
超幾何分布 母集団サイズ,
母集団内の成功数,
標本サイズ
(非復元抽出)
X :標本内の成功数,
0 ≦ X ≦ 標本サイズ
(非復元抽出)

[X の乱数]





hyper-geometric
幾何分布 成功率 X :1回成功するまでの試行回数,
0 ≦ X

[X の乱数]





geometric
負の二項分布
(パスカル分布)
成功率,
定めた成功回数
X :定めた成功回数に至るまでの試行回数,
0 ≦ X

[X の乱数]





pascal
離散一様分布 有限区間の上限,
有限区間の下限
X :有限区間内の数値,
下限 ≦ X ≦ 上限

[X の乱数]




平坦
discrete uniform
多項分布 試行回数,
成功率1,
成功率2,
成功率3,...
(全成功率の和は1)
X1X2X3, ... :各成功回数
X1X2X3+... =試行回数

[X の乱数]
多次元型

(二項分布の多変量化)
multinomial distribution


2. 連続型確率分布 (Continuous probability distributions)

 確率変数がある区間内の全ての実数を取り得る場合は「連続型」といいます.

確率分布の名称
母数
(パラメータ)
確率変数X
その範囲(区間)
単峰形 単調形 その他の
分布形
分布形(グラフ)の一例
対称 歪み 減少 増加
正規分布
(ガウス分布)
N ( μ, σ² )
平均 μ
分散 σ²
X :実数,
—∞ < X < ∞

[X の乱数]





normal
対数正規分布 平均,
分散
X :実数,
0 < X < ∞

[X の乱数]





log-normal
指数分布 ポアソン分布に従う事象が1回生じるまでの待ち時間の平均 X :待ち時間
0 ≦ X < ∞

[X の乱数]





exponential
アーラン分布 ポアソン分布に従う事象が定めた回数生じるまでの待ち時間の平均,
定めた事象の回数
X :待ち時間
0 ≦ X < ∞

[X の乱数]





erlang
ワイブル分布 形状パラメータ,
尺度パラメータ,
位置パラメータ
X :寿命時間
0 ≦ X < ∞

[X の乱数]





weibull
三角分布 有限区間の上限,
頂点,
有限区間の下限
X :実数,
下限 ≦ X ≦ 上限

[X の乱数]





triangle
連続一様分布
(矩形分布)
有限区間の上限,
有限区間の下限
X :実数,
下限 ≦ X ≦ 上限

[X の乱数]




平坦
rectangle
ベータ分布 形状パラメータ1,
形状パラメータ2
X :実数
0 ≦ X ≦ 1

[X の乱数]




U型
平坦
beta
多変量正規分布 期待値ベクトル,
分散共分散行列
Xi :実数
—∞ < Xi < ∞

[X の乱数]
多次元型

(正規分布の多変量化)
multivariate normal distribution


3. 統計的仮説検定で用いられる確率分布 (Probability distribution for the statistical hypothesis testing)

 何を推定・検定するのかによって,それぞれの目的に応じた確率分布があります.推定・検定には多くの手法がありますが,ここでは,推定や検定でよく用いられる代表的な確率分布とその検定統計量の一例を次に示します.

確率分布の名称
母数
(パラメータ)
確率変数X
その範囲(区間)
統計的仮説検定 分布形(グラフ)の一例
名称 検定目的の一例
標準正規分布
N ( 0, 1 )
平均 μ = 0,
分散 σ² = 1
(母数は定数)
X :実数,
—∞ < X < ∞

[分布表]
Z検定
平均の検定(母分散が既知 or 大標本)

検定統計量:(標本平均−検定する平均)
を,√(分散/標本サイズ)で割ったもの
standard normal distribution
t分布 自由度 X :実数,
—∞ < X < ∞

[分布表]
t検定
平均の検定(母分散が未知 and 小標本)

検定統計量:(標本平均−検定する平均)
を,√(分散/標本サイズ)で割ったもの
student's t distribution
カイ二乗分布 自由度 X :実数,
0 ≦ X < ∞

[分布表]
χ²検定
分散の検定

検定統計量:偏差平方和を,検定する分散で割ったもの
chi-square distribution
F分布 自由度1(分子),
自由度2(分母)
X :実数,
0 ≦ X < ∞

[分布表]
F検定
2つの独立した母集団の分散の検定

検定統計量: 分散1 / 分散2
F distribution
統計的仮説検定で用いられる確率分布
standard normal distribution chi square distribution student's t distribution F distribution

4. 確率分布の関係

 それぞれの確率分布は相互に関係があります.特に確率変数の畳み込み(和)や極限(収束),変数変換等によって強い関係を持つ場合もあります.ここでは確率分布の関係を図にしたものを示します.
確率分布の関係図
beta erlang triangle weibull lognormal rectangle exponential normal multivarnormal uniform poisson binomial multinomial geometric pascal hypergeometric

【参考文献】
[1] 蓑谷千凰彦,統計分布ハンドブック,朝倉書店,2003
[2] 京極一樹,ちょっとわかればこんなに役に立つ統計・確率のほんとうの使い道,実業之日本社,2012


[ 
確率・統計 | 教材・資料(情報教育用) | 情報科学・システム工学(中川雅央) HOME ]