2.1 データの分類


ここでは、S+SpatialStats(以下 S+SS)で扱うことのできるデータの種類と、それぞれのデータに提供される解析手法の概略について説明する。

S+SSによる空間データの分類は、前述のものと異なり、以下のようになる。

  1. GeoStatisticalデータ (Geostatistical Data)
  2. 格子データ (Lattice Data)
  3. 点パターンデータ (Spatial Point Patterns)

1と2のタイプが前述の空間回帰モデルを当てはめるデータに相当し、3のタイプが点パターンモデルを当てはめるデータになる。つまり、ランダム閉集合についてはS+SSでは扱わない。

GeoStatisticalデータ

確率場データとも呼ばれる。観測地点(一般に、連続空間上の点)が固定されている。

(例)
採掘場内のいくつかのテストサイトの値(鉱石の含有率)
測候所の降雨記録
観測地点における汚染物質の濃度
ある河川の流域のサンプル地点での土壌の浸透率
海洋上の固定した観測点におけるホタテ貝の個体数(離散データ)

GeoStatisticalデータはしばしば、小規模変動という性質を持つ。2つの観測地点の距離が近ければ、観測値も類似してくる、という性質で、観測値の空間的な変動を観測地点どうしの距離の関数としてモデリングする。以下のような解析が可能である。(3章で詳しく述べる)

格子データ (Lattice Data)

規則的もしくは不規則に配置された領域の集まりに付随する観測値で、一般に「近傍情報」が利用可能である。

(規則的な格子の例) 人工衛星によるリモートセンシングデータ(R2上の規則的な格子)
(不規則な格子の例) ある州内の各郡のガン発生率

格子(Lattice)の数学的定義

頂点(vertex)と辺(edge)からなる。格子データの場合、各サイトが頂点であり、近傍どうしが辺で結ばれている。

近傍どうしの結びつきの強さを設定する、「重み」を与えることもできる(例 共有する州境の長さに比例させた重み)。以下のような解析が可能。4章で詳しく述べる。

空間点パターン (Spatial Point Patterns)

データタイプの説明は1章と重複するので省略。以下のような解析が可能。

次へ 戻る

ご意見、ご感想はNTTデータ数理システムS-PLUSグループ <splus-info@msi.co.jp>