バックナンバー Vol.10 2020 年 07 月 15 日発行

効率的なネットワーク構造の決定の仕方について

BayoLinkSメールマガジン

平素より BayoLinkS をご愛用いただき誠にありがとうございます。

今回と次回の2回に渡ってネットワークの因果の関係を考慮しながら、構造を特定する方法を
ご紹介させていただきます。

【今回のテーマ】
~ 効率的なネットワーク構造の決定の仕方について ~

具体的には次のような方法です。

(1)	まず変数間の関連を統計的な検定手法で抽出します。
(2)	そのようにしてネットワークの形の可能性を絞った上で、
	因果関係を表現するように矢印の向きを定めます

今回は主に(2)に関連して『矢印の向きとネットワークの因果関係をどのように解釈するか』
ということをお話しいたします。 ((1) については次回です)

ごく簡単な問題の設定として、以下のような分析を行うことを考えます。

・あるブランドの製品に関するアンケート調査から顧客属性がブランドイメージや商品の満足度に
 どのように影響するかを分析します。顧客属性は『年代』のみとして『ブランドイメージ』と
 『商品満足度』との関係をベイジアンネットワークで分析します。

ベイジアンネットワークにおける分析では、実際の因果関係を表すネットワークの構造を決める
必要があります。つまり『年代』・『ブランドイメージ』・『商品満足度』の間で原因と結果の
向きを表す矢印をどのように引いたらよいかを考えなければなりません。

しかし、一般に2つの間の関連についてはデータから見出すことができますが、一方その間の
因果の向き決定することは非常に難しいものとなります。
関連の有無については相関を求めるだけでわかるのに対して、因果の向きとなるとモデルと
現実との間で意味の乖離がないかなどの検証を行う必要があるためです。

さらに因果の向きを考えた場合、関連の有無を確認する回数とは比較にならないほどの因果関係の
可能性についても検証することになります。
3変数だけでも考えられるネットワークの可能性は25通りにもなります。
そこで 検討するべきネットワークを絞りこむために、まずは矢印の方向は考えないで変数間の
依存関係を抽出します。この検定方法については次回紹介しますが、今回はアンケートの項目の
関係を以下のように定めます。
   
 ・『年代』と『ブランドイメージ』には直接の関係がなさそうである
 ・『ブランドイメージ』と『商品満足度』との間では直接の関係がありそうである
 ・『商品満足度』と『年代』との間でもある直接の関係がありそうである

関係が想定される部分を「---」で表すと以下の通りとなります。

  『ブランドイメージ』---『商品満足度』---『年代』

「---」は実際には矢印であって「<--」か「-->」のどちらかです。

ここまで条件が制限されると考えられるネットワークのパターンはだいぶ少なく、
次の4通りのみとなります。

   (A)『ブランドイメージ』-->『商品満足度』<--『年代』
   (B)『ブランドイメージ』<--『商品満足度』-->『年代』
   (C)『ブランドイメージ』<--『商品満足度』<--『年代』
   (D)『ブランドイメージ』-->『商品満足度』-->『年代』

それぞれは次の通りに解釈できるかと思います。

【Aの解釈】
ブランドイメージと年代の2つの組み合わせで商品の満足度の値の傾向がきまります。
2つ組み合わせで商品満足度の傾向が決まるのであって、それぞれの影響の重ね合わせでは
ありません。例えば、年配の利用者はブランドイメージと商品満足度に正の相関があるが
比較的若い世代ではあまり相関がないなどがそのような場合です。

【Bの解釈】
商品満足度からブランドイメージと年代が決まります。
例えば、年代に関係なく商品満足度が高いブランドイメージも良く、また商品満足度ごとの年代の
構成もブランドイメージに関係なく一定の形となっている場合などです。
この形では、ブランドイメージと年代が商品満足度の傾向を決める場合に、年代と商品満足度を
関係とブランドイメージと商品満足度の関係の「足し合わせ」に近いものになります
(このモデルはナイーブベイズと呼ばれます※)。

【Cの解釈】
年代から商品満足度の傾向が決まり、商品満足度がブランドイメージの傾向を決めるものです。
例えば、商品満足度の高い人(または低い人)は全年代共通で同じブランドイメージの傾向と
なっていて、しかも年代が商品満足度の傾向を左右しているので、結果として年代ごとで
ブランドイメージ傾向が決まっている場合などです。

【Dの解釈】
Cの逆のケースとなります。なお、ベイジアンネットワークではCとDに違いはありません。

A~Dのどれが良いかについては、AIC等の評価指標の値を考慮しつつモデルの解釈と現実との
間で乖離が少ないものを選ぶことになります。

次回は、「直接の関係」を特定するための分析手法についてお話をさせていただきます。