基本統計量 basic statistics - 数理的思考 - 中川雅央 【知と情報の科学】

LEVEL I

■ 基本統計量 (basic statistics)


1. データを要約した情報 = 基本統計量

   記述統計量 (descriptive statistics),要約統計量 (summary statistics) ともよばれる. 得られたデータをそのまま見ていても,数字の羅列があるだけである.データを整理・要約することによって新しい情報が得られて,とても役に立つことが多い.

2. データの中心的傾向

   データの性質を簡潔に表現するために,1つの数値が代表値(averages)として使われる場合がある.その中心の尺度を示す統計量で,統計では「平均 (mean)」,「中位値 (median)」,「最頻値 (mode)」の3つがよく用いられる.

3. データのバラツキ具合

   データのまとまい具合や変動の尺度,散布度 (dispersion).「分散 (variance)」,「標準偏差 (standard deviation)」は統計において特に重要な指標である.

4. データの分布の形


5. データの大きさ


6. 基本統計量の計算方法

   主要な基本統計量の計算式およびそれに対応する表計算ソフトの関数を用いた算出方法を一覧表に示す.なお,表計算ソフトによって関数の定義が異なる場合があるので詳細は表計算ソフトのヘルプを確認されたい(表中※印).
   得られた n 個のデータを x1 , x2 , ... , xn とし, それを昇順(小さい順)に並べ替えたものを x(1) , x(2) , ... , x(n) と表記する.

基本統計量 計算式 表計算の関数
平均 x (Σ xi )/ n
=AVERAGE(セル範囲)
中位値 x{(n+1)/2}   if n is odd.
(x(n/2)x{(n/2)+1})/2   if n is even.
=MEDIAN(セル範囲)
最頻値 (本文参照)
=MODE(セル範囲)
分散 s 2
不偏分散 σˆ  2
s 2Σ ( xix ) 2n
σˆ  2Σ ( xix ) 2/ (n−1)
=VARP(セル範囲)
=VAR(セル範囲)
標準偏差 s
不偏標準偏差 σˆ

s ²
σˆ ²

=STDEVP(セル範囲)
=STDEV(セル範囲)
歪度 {Σ ( xix ) 3n } / s 3
=SKEW(セル範囲) ※
尖度 {Σ ( xix ) 4n } / s 4
=KURT(セル範囲) ※
最小値 x(1)
=MIN(セル範囲)
最大値 x(n)
=MAX(セル範囲)
標本サイズ n
=COUNT(セル範囲)
合計 Σ xi
=SUM(セル範囲)


[ 基本統計量の計算 (JavaScriptによる計算ツール) ]

[ 確率・統計 | さまざまな確率分布 | 教材・資料(情報教育用) | 情報科学・システム工学(中川雅央) HOME ]