[(株)数理システム]

(S-PLUS) S-PLUS mini course 第33回


S-PLUS mini course の33回目をお届けします。

東京ではそろそろ秋の気配が感じられます。
皆様はお変わりございませんか?

まず最初に、株式会社数理システムが開催していますS-PLUS セミナーについてのお知らせです。
*********************************************
10月15日から S-PLUS for Windows 応用という新しいトレーニングコースをスタートさせます。
詳しくは
http://www.msi.co.jp/splus/support/training.html#ouyou
をご覧ください。
他のトレーニングコース同様、メンテナンスご契約をいただいているお客様はご契約件数まで無償で、それ以外の方でも\10,500-で受講していただけます。受講のご予約はお早めにsplus-info@ml.msi.co.jp までお知らせください。
*********************************************

さて、前回は

tr <- tree(Fuel ~ Disp. + Weight + Type, data=fuel.frame)
plot(tr)
text(tr)


というコマンドをご紹介したところで終わりでしたが、どんなグラフになりましたか?なんだかトーナメント表みたいなグラフができたことと思います。

グラフの見方
トーナメント表とは異なり、上から順に見ていきます。
データはおなじみの車のデータですね。燃費(Fuel) を排気量(Disp.)、重さ(Weight)、車の種別(Type) から予測します。同じような式をlm に当てはめて、回帰分析をしたことがありました。
グラフのてっぺんを見ると、「Disp. < 134」という記述があると思いますが、これは、「ある車があったとき、その車の燃費を予測したい」という目的があって、1台の車の燃費を導き出します。回帰ならば、説明変数(この場合3個)に対して、係数をかけて足して計算しますが、樹形モデルの場合、このグラフを上から順にたどっていきます。
つまり最初の条件は、「その車の排気量が 134 未満だったら、左へ、以上だったら右へ」と進ませるものです。もし、左に進んだとすれば、次にまた条件が待ち構えていますね。今度は「Weight < 2280」つまりその車の重さは 2280 より小さいかどうかが条件として与えられ、小さければ、2.948 という数字に行き着きますが、これがそのような種類の車の予想される燃費になります。ここは、元のデータ fuel.frameの中の、その条件に当てはまる車の平均値となっています。

次回はなぜこのようなグラフが導き出されたのかについて、ご説明したいと思います。
お楽しみに!

----------------------------------------------------------------

? お問い合わせ/資料請求はお気軽に。
(株)数理システム《S-PLUS》グループ <splus-info@ml.msi.co.jp>