資料全体の位置をあらわす数を代表値、資料が代表値のまわりに密集して存在しているか、ちらばっているかを表す数を散布度といい、その表し方には種々の量が用いられています。
一組の資料の代表値として、平均値、中央値などがあります。そのなかで平均値はもっともよく使われる値で、統計学の基本的概念です。
M = 1/n(x1+x2+・・・+xn) = (1/n)ΣXn
(例題 2.2) 表2.1のデータの平均点を計算する |
> mean(x)
[1] 65.14
資料の大きさの順に並びかえたとき、中央にきた資料の値をいい、偶数個のときは中央にきた2個の平均をとります。すなわち
x1 < x2 < ・・・ < xn
と並べたとき、次の値をとります。
nが奇数、すなわち n = 2k + 1 ならば XK+1
nが奇数、すなわち n = 2k ならば (XK+1+XK+1)/2
(例題 2.3) 表2.1のデータの中央値を計算する |
> median(x)
[1] 63
この「平均」の基本的性質は次の通りです。