[株式会社 NTTデータ数理システム]

第2章 統計資料の整理


2.2 資料の数量的表現

資料全体の位置をあらわす数を代表値、資料が代表値のまわりに密集して存在しているか、ちらばっているかを表す数を散布度といい、その表し方には種々の量が用いられています。

(1) 代表値

一組の資料の代表値として、平均値、中央値などがあります。そのなかで平均値はもっともよく使われる値で、統計学の基本的概念です。

(i) 平均値
M = 1/n(x1+x2+・・・+xn) = (1/n)ΣXn
(例題 2.2) 表2.1のデータの平均点を計算する

> mean(x)
[1] 65.14

(ii) 中央値(または中位数、中間数)

資料の大きさの順に並びかえたとき、中央にきた資料の値をいい、偶数個のときは中央にきた2個の平均をとります。すなわち

x1 < x2 < ・・・ < xn

と並べたとき、次の値をとります。

nが奇数、すなわち n = 2k + 1 ならば XK+1
nが奇数、すなわち n = 2k ならば (XK+1+XK+1)/2
(例題 2.3) 表2.1のデータの中央値を計算する

> median(x)
[1] 63

この「平均」の基本的性質は次の通りです。