感度分析について
BayoLinkSメールマガジン
日頃 BayoLink をご利用いただき、誠にありがとうございます。
今回は、BayoLink に搭載されている機能の中から、感度分析について、簡単ではございますが、
お話しさせていただきます。
●感度分析より何が見られるのでしょうか。
感度分析は、説明変数の値が変化したときの目的変数の値の変化の程度 (感度) を分析することで、
このときのネットワーク構造のモデルにおける説明変数と目的変数の依存の程度を調べる分析です。
●感度分析はどのような場面で用いられるのでしょうか。
例えば、
アンケートデータで商品の満足度とアンケートの回答の関係を把握する際に用いられます。
具体的には、商品を「満足しない」から「満足する」と答えが変化することに一番影響がある
アンケート項目の組合せを探すことができます。
1 対 1 の変数間の関係だけからは見えてこない 1 対多の関係性を見出せるというメリットがあります。
また、製造業における問題に対してもこの感度分析を利用することがあります。
複数の工程を通って製品が作られるときに、製品の不具合に最もつながる工程や運転パラメータ等の
組合せを探し出すことなども、その一例です。
●感度分析はどのように分析を行うのでしょうか。
感度分析は、観測が入力されたときの現象が発生する確率、つまりエビデンスを説明変数に
設定したときの目的変数の確率推論値 (事後確率) と、観測値の入力前に想定される現象の発生する
確率 (事前確率) との関係を比較することで行います。このとき、BayoLink では、主に次の 3 つの
評価指標を算出・比較をし、分析します。
・相互情報量
・確率の差分
・リフト値
それぞれの指標値はすべて、説明変数と目的変数の依存の程度を示す統計量です。
これらは、事前分布と事後分布の 2 つから求まります。
● 3 つの指標値はどのように解釈すれば良いのでしょうか。
また、どのように使い分ければ良いでしょうか。
・相互情報量の見方について
相互情報量は、変数間の依存関係の強弱を 1 つの数値で表したものです。この値は、変数間の
依存関係が全くない場合は、0 となります。一方で、依存関係が少しでもある場合は、正の数値を
とります。なお、この数値の大小の判断に明確な基準はありませんので、説明変数グループの中での
相対的な見方で大小を判断する必要があります。
・確率の差分の見方について
確率の差分は事後確率から事前確率を引いた値です。特定のエビデンスを与えたときの、目的変数の
値ごとの確率 (事後確率) の変化の幅を表します。この値が正のときは、エビデンスを与えると
与えなかったときより、事後確率が増加することを意味します。一方で、負の値のときは、
エビデンスを与えた場合、与えなかったときに比べ確率値が減少することを意味します。
なお、値の大小の判断については、明確な基準はありません。
・リフト値の見方について
リフト値は、エビデンスが与えられたときの目的変数の事後確率と、その目的変数の事前確率の割合を
意味します。これは、下記の式で表されます。
リフト値 = p(x|e) ÷ p(x)
(p は確率関数、x は目的変数値、e はエビデンスを表します)
つまり、目的変数値が観測される確率が、エビデンスが与えられたことからどれだけ持ち上げられた
(リフトされた) かを表します。この値は、1 より大きいとき、エビデンスが与えられることによって
事後確率が増加することを意味します。また、1 未満の場合は、エビデンスが与えられることによって
事後確率が減少することを意味します。なお、この値の大小の判断についても、明確な基準は
ありません。
・上記 3 つの指標値の使い分け方について
目的変数の各値を見ないで、総合的に目的変数のエビデンスに対する感度を判断する場合は、
相互情報量を見ます。逆に、値ごとに感度を判断する場合は、確率の差分もしくは、リフト値を見ます。
確率の差分とリフト値の使い分けについては明確な決まりはありません。どちらも、目的変数の
事後確率と事前確率の値の大きさや、各エビデンスの組み合わせにおける値の変化の程度により
相対的に値の大小の判断をする必要があるからです。
最後となりましたが、これら統計量の定義や意味は、BayoLink マニュアル P102~
「10.3 検証・感度分析」に詳しい内容が記載されておりますので、感度分析をより深く
理解されたい場合は、どうぞこちらもご覧くださいませ。
(2018.7.19. 北沢 芳明)