S-PLUS
mini course 第1回
さて、1回目はやはり「データ・フレーム」について取り上げましょう。
何しろ、
- Excel のデータをインポートしても
- メニューから新しいデータセットを作成しても、
- read.table でテキストファイルを読み込んでも、
いずれもデータ・フレームになります。おまけに、S-PLUS
でデータ解析を行うとき、これら関数はすべて
データ・フレームを前提にしているのです。
さて、こんな風に使用頻度の高いデータ・フレームですが、「じゃ、
行列とどこが違うの」とか、「Excel
のデータとどこが違うの」と疑問に思われるかもしれません。
行列との違い
- 行列は「数値ならば数値」「文字ならば文字」と、1つの型(mode)で構成されていなければなりません。
- データ・フレームは「列」ごとに数値、文字(因子)、...とデータの型を変えて持つことができます(ただ、1つの列は1つの型であること
が求められます)。
- 突き詰めると、行列が「ベクトル」であるのに対して、データ・フレームは「リスト」です。
Excel データとの違い
- Excel では、スプレッドシートにヘッダーをつけたり、フッターや注釈をつけたりすることができます。また、セル単位でプロパティを変えることができますから、1つの列に文字のデータと数値を置くことが可能です。
- S-PLUS のデータ・フレームはきっちり、四角い形をしている必要があります。つまり、ヘッダーや注釈といった、形を乱すものは置くことができません。
- また、データ・フレームでは、列ごとに1つの型(mode)になっている必要があります。
第1回目はなんだか漠然とした話でしたが、2回目はこの行列とデータ・フレームを使った便利な関数について、触れたいと思います。
お楽しみに!
(株)数理システム《S-PLUS》グループ <splus-info@ml.msi.co.jp>