正規分布 normal distribution - 数理的思考 - 中川雅央 【知と情報の科学】

LEVEL I

■ 正規分布 (normal distribution)


1. 確率的な現象と正規分布

 データをいくつかの階級に分けて度数分布表やヒストグラムを作成したとき,中心付近の度数が最も高くなり,そこから左右に同程度で度数が少なくなっていく形になることは多いと思います.測定誤差や社会現象あるいは自然現象の中に現れるバラツキは正規分布 (normal distribution) に従うと見なせるものが多く,統計学の理論上も応用上も非常に重要で実用性の高い分布です.
 正規分布は,自然現象や社会現象において広くあてはまる確率分布です. 19世紀にガウス (Carl Friedrich Gauss 1777〜1855) が観測誤差の研究から導いたことが有名であることからガウス分布 (Gaussian distribution) と呼ばれることもありますが,それ以前にも各分野の研究者によってこの確率分布が導出されており,また誤差の分布として基本的な性質を備えているために最も多くの確率事象に適用される分布であることから,normal (一般的:正規)な分布と呼ぶようになりました.

Figure 1 (a)

2. 正規分布の性質

 正規分布は N ( μ , σ 2 ) と表記し,平均 μ と分散 σ 2 が定まれば正規分布の形が決まります.正規分布は平均 μ を中心として左右対称になった西洋の釣鐘と似た形状の曲線(ベルカーブ)を描きます. 平均 μ は分布形の位置を表しており,分散 σ 2 (標準偏差 σ )は大きくなるほど裾野が広がる形になります.連続型の確率変数 X が正規分布 N ( μ , σ 2 ) に従うとき,その確率密度関数 f ( x ) は
function
となります.確率変数 X - ∞ < x < + ∞ の範囲の実数をとります.この f ( x ) は x = μ のときが最大値であり, x = μ ± σ の点が変曲点となっています.
Figure 2 (b)  平均 μ = 0 ,分散 σ 2 = 1 の正規分布 N (0, 1) を特に標準正規分布 (standard normal distribution) といいます. N ( μ , σ 2 ) に従う確率変数 X を次に示す1次式で変換(線形変換)すると,変換された確率変数 Z は標準正規分布 N (0, 1) に従います.
standardizing
 この変換を標準化変換(standardizing) といいます.変換されたこの z は z 得点 (z score) または標準正規偏差 (standard normal deviate) と呼ばれます.あらゆる正規分布は,標準化変換によって標準正規分布 N (0, 1) に帰着します.したがって,正規分布の計算は,標準化変換をして標準正規分布で計算し,必要に応じて元の正規分布に戻せばよいことになります.

Figure 2

3. 標準正規分布

 標準正規分布 N (0, 1) は, z = 0 の点を中心(平均)とした形です.したがって, z = 0 で確率は半々ですから P = 50% となります.確率変数 X のある値 x を標準化変換した z の意味は,元の一般的な正規分布の値 x が,平均 μ から標準偏差 σ z 倍だけ離れているということを示しています. 標準正規分布 N (0, 1) に従う確率変数 Z の確率密度関数をN(0,1) PDF ,累積分布関数(下側確率)をN(0,1) CDF と表すと,次のようになります.
standard normal distribution
確率密度関数について,負の無限大から z までの範囲を積分計算したもの(面積)が累積分布関数(下側確率)です(図を参照).この標準正規分布の累積分布関数には,正規分布の性質から次のような特徴があります.
CDF (standard normal distribution)
累積分布関数の積分は解析的に計算できないので,コンピュータ等を用いて求めることになります.計算されたものを数表としてまとめた 正規分布表 があります.また,主な表計算ソフトには標準正規分布に関する関数 (NORMSDIST, NORMSINV, ...) が用意されています.
Figure 3

4. 正規分布の理論的な位置づけ

 正規分布に従わないどのような分布であっても,その標本平均の分布は正規分布で近似できる性質(中心極限定理)があります.また二項分布など確率分布の中にはその極限値が正規分布に近づくものも少なくありません(→確率シミュレーション.一方,推定や検定に用いられる主要な確率分布(t分布、F分布、カイ二乗分布など)は正規分布を理論基盤としています.このように正規分布は推測統計の基礎となる最も重要な確率分布です.


[ 正規分布 (normal distribution) | 正規分布表 | 正規分布表(高精度版) | 正規分布表(パーセント点) ]

[ 確率・統計 | さまざまな確率分布 | 教材・資料(情報教育用) | 情報科学・システム工学(中川雅央) HOME ]