5.2 完全ランダム性の尺度


完全ランダム性(CSR: Complete Spatial Randomness, Diggle, 1983)とは、以下のとおり。

強度(単位面積当りの点の個数)が有界領域 A 内で変化しない

正確には
A の面積を |A| とすると、A 内の単位面積当りの点の個数は均一に平均 λ |A| のPoisson分布に従う。(ここで λ は一定の強度)

点どうしに相互作用はない

正確には
領域 A 内の n個の点の位置 x1,x2,...,xn は A 上で一様分布する確率変数 X から独立にサンプリングされたものである。

樹木データを樹木の種類別にプロットしてみる(下図)

→ 互いの種の生息を抑制する傾向が見られる

(図: Lansing データの点パターンを樹木の種類別にプロット)

点-点最近接統計量

di を i番目の点から一番近い点までの距離とする。点-点最近接距離の経験分布関数

n は A 内の点の個数)

を計算するのが、関数 Ghat。自動的に関数のプロットを行うので、作図したくなければ plot=F とする。

クラスタ型は y が小さいところですぐが大きくなるし、規則型では逆に y が大きくなるまで の値は大きくならない。理論分布(CSR)に対するプロットも可能だが、この場合、境界効果を無視するので、境界効果を取り入れたければ以下の手順を踏む。

1次元上データ(時系列など)の境界は点、すなわち0次元であったが、空間データの場合、境界が線、すなわち1次元になるため、もはやこの効果を無視することが出来ない。点パターンデータの場合、観測領域の外側にも同様に点が分布していることを考慮に入れなければならなくなる。
  1. 元データと同じ領域内で、強度 n/|A| のCSRプロセスから s組の点パターンを s回のシミュレーションによって得る。
  2. s本のが求まるので、それらの平均、最大、最小関数を求める。
  3. 元データから求めたがその最大、最小関数の中(envelope)に収まっていればCSRと断定。

点パターンの作成には、関数 make.pattern を用いる。

原点-点最近接統計量

ei を i番目の原点から一番近い点までの距離とする。原点-点最近接距離の経験分布関数を

( m は原点の個数)

と定義する。この値は関数 Fhat を用いて計算することができる。原点どうしの距離、つまり grid の幅は指定しなければ となる。原点を座標指定して与えることもできる。

Fhat の解釈は Ghat と全く逆になり、x が大きいところでが大きくなればクラスタ型となる。

G(y) と F(y) の理論的関係

もし境界効果が無視できて、点の数が比較的多い場合、点パターンがCSRであれば、

G(y) = F(y) = 1 - exp( -πλy2 )

が成り立つ。ここで λ は強度。λ ( = n/|A| ) で置き換えて、Fhat(y) を 1 - exp( -πλy2 ) に対してプロットしてみて、直線になればCSRである。

次へ 戻る

ご意見、ご感想はNTTデータ数理システムS-PLUSグループ <splus-info@ml.msi.co.jp>