LEVEL I

さまざまな確率分布 probability distributions - 数理的思考 - 中川雅央 【知と情報の科学】



LEVEL I

■ さまざまな確率分布 (probability distributions)

 観測される現象は,確率的に変動するものが多いと考えられます.その観測されたデータを説明する統計モデルに,どの確率分布を使えばうまく説明できるでしょうか.
 正規分布や二項分布など,確率分布の種類は数多く,いろいろなカタチ(分布形)があります.確率分布の当てはめを考えるには,そのカタチ(分布形)を知ることが重要です.各確率分布の母数(パラメータ)によってそのカタチ(分布形)が決まります.確率変数には離散型と連続型があり,その範囲もさまざまです.
 このページは,代表的な確率分布について,それらを比較・検討しやすいように母数(パラメータ)やグラフ等を一覧表にまとめたものです.


1. 離散型確率分布 (Discrete probability distributions)

 確率変数のとる値が有限個,あるいは無限個であっても自然数で番号が付けられる場合は「離散型」といいます.離散型のグラフは,横軸の確率変数がその値になるときの確率を縦軸で表しています.

確率分布の名称 母数
(パラメータ)
確率変数X
その範囲(区間)
単峰形 単調形 その他の
分布形
分布形(グラフ)の一例
対称 歪み 減少 増加
二項分布 試行回数,
成功率
X :成功数,
0 ≦ X ≦ 試行回数

[X の乱数 | 統計数値表]





binomial
ポアソン分布 発生回数の平均 X :発生回数,
0 ≦ X

[X の乱数 | 統計数値表]





poisson
超幾何分布 母集団サイズ,
母集団内の成功数,
標本サイズ
(非復元抽出)
X :標本内の成功数,
0 ≦ X ≦ 標本サイズ
(非復元抽出)

[X の乱数]





hyper-geometric
幾何分布 成功率 X :1回成功するまでの試行回数,
0 ≦ X

[X の乱数]





geometric
負の二項分布
(パスカル分布)
成功率,
定めた成功回数
X :定めた成功回数に至るまでの試行回数,
0 ≦ X

[X の乱数]





pascal
離散一様分布 区間の開始点,
区間の幅
X :区間内の数値,
開始点 ≦ X ≦ 開始点+幅-1

[X の乱数]




平坦
discrete uniform
多項分布 試行回数,
成功率1,
成功率2,
成功率3,...
(全成功率の和は1)
X1X2X3, ... :各成功回数
X1X2X3+... =試行回数

[X の乱数]
多次元型

(二項分布の多変量化)
multinomial distribution



2. 連続型確率分布 (Continuous probability distributions)

 確率変数がある区間内の全ての実数を取り得る場合は「連続型」といいます.連続型のグラフは,横軸の確率変数が連続量なので,縦軸はその値での確率密度を表しており,区間内(横軸のある値とある値の間)を積分した面積がその確率に相当します.

確率分布の名称
母数
(パラメータ)
確率変数X
その範囲(区間)
単峰形 単調形 その他の
分布形
分布形(グラフ)の一例
対称 歪み 減少 増加
正規分布
(ガウス分布)
N ( μ, σ² )
平均 μ
分散 σ²
X :実数,
—∞ < X < ∞

[X の乱数]





normal
対数正規分布 平均,
分散
X :実数,
0 < X < ∞

[X の乱数]





log-normal
指数分布 ポアソン分布に従う事象が1回生じるまでの待ち時間の平均 X :待ち時間
0 ≦ X < ∞

[X の乱数]





exponential
アーラン分布 ポアソン分布に従う事象が定めた回数生じるまでの待ち時間の平均,
定めた事象の回数
X :待ち時間
0 ≦ X < ∞

[X の乱数]





erlang
ワイブル分布 形状パラメータ,
尺度パラメータ,
位置パラメータ
X :寿命時間
0 ≦ X < ∞

[X の乱数]





weibull
ガンマ分布 形状パラメータ,
尺度パラメータ
X :寿命時間
0 ≦ X < ∞

[X の乱数]





gamma
三角分布 有限区間の上限,
頂点,
有限区間の下限
X :実数,
下限 ≦ X ≦ 上限

[X の乱数]





triangle
連続一様分布
(矩形分布)
有限区間の上限,
有限区間の下限
X :実数,
下限 ≦ X ≦ 上限

[X の乱数]




平坦
rectangle
ベータ分布 形状パラメータ1,
形状パラメータ2
X :実数
0 < X < 1

[X の乱数]




U型
平坦
beta
多変量正規分布 期待値ベクトル,
分散共分散行列
Xi :実数
—∞ < Xi < ∞

[X の乱数]
多次元型

(正規分布の多変量化)
multivariate normal distribution



3. 母数推定や仮説検定などの推測統計で用いられる確率分布 (probability distributions for statistical inference)

 何を推定・検定するのかによって,それぞれの目的に応じた確率分布があります.推定・検定には多くの手法がありますが,ここでは,推定や検定でよく用いられる代表的な確率分布とその統計量の一例を次に示します.

確率分布の名称
母数
(パラメータ)
確率変数X
その範囲(区間)
推定・検定 分布形(グラフ)の一例
統計量 用途の一例

標準正規分布
N ( 0, 1 )
平均 μ = 0,
分散 σ² = 1
(母数は定数)
X :実数,
—∞ < X < ∞

[統計数値表]
z 値
大標本 または 母分散が既知 のときの
信頼区間の推定,平均の検定

統計量:(標本平均-検定する平均)
を,√(分散/標本サイズ)で割ったもの
standard normal distribution

t分布

(小標本の分布)
自由度 X :実数,
—∞ < X < ∞

[統計数値表]
t 値
小標本 かつ 母分散が未知 のときの
信頼区間の推定,平均の検定

統計量:(標本平均-検定する平均)
を,√(分散/標本サイズ)で割ったもの
student's t distribution

カイ2乗分布

(誤差の2乗和の分布)
自由度 X :実数,
0 ≦ X < ∞

[統計数値表]
χ² 値
Pearsonのχ² 検定 (適合度検定・独立性検定)

統計量:(観測度数-期待度数)の2乗を期待度数で除したものの総和
chi-square distribution

F分布

(分散比の分布)
自由度1(分子),
自由度2(分母)
X :実数,
0 ≦ X < ∞

[統計数値表]
F 値
例えば,要因の分散/誤差の分散,信号/ノイズ(S/N比)など,2種類の分散を比率で表したF値(F比)による検定

統計量: 分散1 / 分散2
F distribution
統計的仮説検定で用いられる確率分布 統計的仮説検定で用いられる確率分布
standard normal distribution chi square distribution student's t distribution F distribution standard normal distribution chi square distribution student's t distribution F distribution

4. 確率分布の関係

 それぞれの確率分布は相互にさまざまな関係があります.特に確率変数の畳み込み(和)や極限(収束),変数変換等によって強い関係を持つ場合もあります.ここでは確率分布間の主な関係を図にしたものを示します.
確率分布の関係図
beta erlang triangle weibull lognormal gamma rectangle exponential normal multivarnormal uniform poisson binomial multinomial geometric pascal hypergeometric


【参考文献】
[1] 蓑谷千凰彦,統計分布ハンドブック,朝倉書店,2003
[2] 京極一樹,ちょっとわかればこんなに役に立つ統計・確率のほんとうの使い道,実業之日本社,2012


[ 
確率・統計 | 教材・資料(情報教育用) | 情報科学・システム工学(中川雅央) HOME ]