あるクラスの国語の試験をしたら、次のような成績であったとします。このデータからどのような情報を得ることができるでしょうか。
表2.1
73 87 63 74 72 60 48 45 82 45
35 62 61 66 61 60 62 76 62 65
60 65 70 62 80 62 63 70 63 55
62 65 83 60 67 70 43 60 80 77
65 72 55 75 45 72 61 62 81 93
※ 上記のデータファイルをkokugo.txtとします。
度数分布による統計資料は、全体の中で何がどれだけを占めているかを示すものです。表2.1に示すデータをみると、そのままでは単なる数字の集まりにすぎませんが、これを次のように組分けして分類整理すると、その傾向が一目でわかります。これを度数分布といいます。
表2.2 度数分布
階級 | 度数 |
30 < X =< 40 | 1 |
40 < X =< 50 | 5 |
50 < X =< 60 | 7 |
60 < X =< 70 | 22 |
70 < X =< 80 | 10 |
80 < X =< 90 | 4 |
90 < X =< 100 | 1 |
各階級の上に対応する度数に比例する面積をもつ長方形を作ったとき、これらの長方形が並んでできた図形をヒストグラムといい、さらにその特徴をビジュアルに表現できます。
早速SーPLUSの関数を用いてヒストグラムを作成してみましょう。
(例題 2.1) 表2.1で示すデータを入力してヒストグラムを作る |
> x <- scan("kokugo.txt")
> win.graph()
> hist(x)
図2.1 ヒストグラム
(C) 中村 健二郎 1997