BayoLinkSに関するFAQ

BayoLinkS や Alkano のベイジアンネットワーク機能に関する FAQ です。Alkano（MSIP製品）のその他機能に関する FAQ はこちらをご参照ください。

旧バージョン(VAP版および単体機能)について

インストール・ライセンス登録・起動に関するトラブル

Q【ver.8.0】インストール中に『事前に.NET Framework 3.5 の機能を有効にしてください...』というメッセージが表示されます

ABayoLinkS には分析プラットフォームである Visual Analytics Platform(VAP)が含まれます。VAP は BayoLinkS のセットアップで自動的にインストールされますが、事前に Microsoft .NETFramework 3.5.1 を有効化する必要があります。
詳しくは下記の「Visual Analytics Platform　インストールガイド」をご参照ください。

C:\Program Files (x86)\Mathematical Systems Inc\Visual Analytics Platform\インストールガイド_VAP.pdf
「2.2.1. NET Framework 3.5.1 の有効化」

Q【ver.8.0】有効なライセンスがあるのにVAPを起動すると『適切なライセンスが見つからなかったため、Visual Analytics Platform の起動に失敗しました。』と表示され起動ができません

Aライセンスの有効期限が切れた場合、上図のようなエラーメッセージが表示されることがあります。
インターネットに接続していただき、Windows のスタート→[MSI Solutions]→[BayoLinkS ライセンスの登録・更新] を実行してください。もし解決されなかった場合、インターネットに接続していただき、Windows のスタート→[MSI Solutions]→[BayoLinkS のシリアル ID の変更]を実行してください。表示された画面のスクリーンショットを『製品サポート』までお送りください。

モデルの自動構築について

Qモデル構築で必要なメモリ使用量はどのような要因で決まりますか

A一般に、モデルの探索に必要なメモリ使用量は、以下のような要因により決まります。

変数の数
変数の数が増えるとモデルの探索空間が大きくなるため、探索に時間がかかるようになります。

探索アルゴリズム
・全探索
指定された探索空間の全てのモデルを探索します。計算のオーダーは N * 2^N (2 の N 乗の N 倍、N は変数の数) となります
・Greedy Search
指定された探索空間内のモデルを小さなモデルから順に探索し、良いモデルが見つからなくなるまで探索します。一般に全探索よりも計算量は小さくなります。

変数の状態数
状態数が大きな変数は、生成される CPT のサイズが大きくなります。

変数の親の数
状態数が小さくても親の数が多くなると、生成される CPT のサイズが大きくなります。

Q大規模データでモデルを構築したいのですが

ABayoLinkSではレコード数が数十万行、カラム数が100程度の大規模な学習データでもモデルを自動構築を行うことが可能です。しかし条件によっては現実的な時間で構築を終了することが困難な場合もあります。このようなモデル構築を行う場合は、次の条件を考慮することで目的が達成される場合があります。

メモリの上限を上げる
BayoLinkS 単体機能の実行で使用可能なメモリは当初512MB(ver 5.0.1以降は1024MB)に設定されています。初期設定のまま大規模データで構造学習を行うとメモリ不足が発生することがあります。
・関連項目
使用メモリの上限を変更したいのですが

最大親数を指定する
モデル構築ウィザードの2ページ目で[最大親数]という項目があります。ここをチェックすると各ノードの親候補を指定した数で制限します。例えば、「3」と指定してモデル探索すると、各ノードの親は最大でも三つまでというモデルが構築されます。

Q学習データのカラム数とレコード数に上限はありますか?

Aモデルの自動構築で扱うことのできるカラム数とレコード数には、上限を設けておりません。但し多すぎる場合にはメモリエラーが発生いたします。
参考までに、以下は構造学習を行った場合のベンチマークです。

ノード数	レコード数	処理時間(秒)
20	100万	45
80	20万	60

※環境
・Windows 10 (x64) CPU: Intel Core i7-7700T CPU 6420 @2.90GHz 2.90GHz
・実装メモリ (RAM): 32GB
・BayoLinkS ver. 7.4

Q[データインポート] でエラーメッセージが表示されます

A[データインポート] で入力画面下のメッセージ欄に次のようなメッセージが表示される場合があります。

[ERROR] 学習データの読み込みでエラーが発生しました:Comparison method violates its general contract!

これはデータに含まれる数値(またはテキスト値) のパターンや順序などにより、まれに発生するエラーです。
BayoLinkS の設定ファイルを変更することで上記のエラーが回避できます。

1.以下のファイルをデスクトップなどにコピーします。
C:\Program Files (x86)\BAYONET\bnstart.bat
2.コピーしたファイルを開き、13行目を次のように書き換えます。
set XMX=-Xmx1024m -Djava.util.Arrays.useLegacyMergeSort=true
(※) 起動メモリを指定する"set XMX=Xmx1024m" の後に "-Djava.util～" を追加しています。
3.ファイルを保存して閉じます。そのまま元の場所に上書きコピーします。
4.BayoLinkS 単体機能を再起動します。

Qモデルの自動構築が失敗します。どのような原因がありますか?

Aモデルの自動構築の途中でエラーメッセージが表示されたり、出来上がったモデルのノードに"CPT"という警告が表示されている場合は、モデルの自動構築が失敗している可能性があります。モデル構築の失敗は、以下が原因の場合があります。

使用禁止文字
学習データに使用禁止文字が使われていないかご確認ください。使用禁止文字については操作マニュアルを参照してください。

学習データのフォーマット
学習データのフォーマットが不正でないか、以下についてご確認ください。
・各レコードのデータとヘッダーのカラムが完全に対応しているか
・データの最終行の後にリターンのみの行や不正な値が入っていないか

Qノードの親子関係をダイアログで1つ1つ設定するのは困難です

Aノードの親子関係は通常モデル構築ウィザードで設定します。しかしノード数が多い場合や複雑な設定を行うときに、1つ1つダイアログで設定するのは大変です。このようなときモデルインフォメーションファイルを使用すると便利です。モデルインフォメーションファイルはモデルの親子関係を記述するファイルで、構築学習ウィザードで指定します。モデルインフォメーションファイルの使用方法は操作マニュアルの＄7.1.2をご参照ください。

Q数値データをBayoLinkSで構造学習の対象とすることはできますか？

A BayoLinkSではカテゴリ型の列を取り扱うため、学習データのインポート時に数値データを離散化(※)する必要があります。
(※)離散化できるのは値の型が「数値型」の場合です(「数値型」は値が数値のみのカラムが該当します)。離散化の区間は、K-means法や等区間法で自動計算できます。また任意の区間を指定することもできます。
離散化をしない場合、数値をそのまま状態値とみなします。
離散化についての詳細は操作マニュアル$6.3.4をご参照ください。

Q数値データでモデル構築を行うと時間がかかります

A学習データに数値のみのカラムが多い場合、モデルの自動構築で非常に時間がかかる場合があります。
原因の1つとして数値データの離散化が考えられます。
離散化は数個のカラムで行われる分は問題ないのですが、数十個になるとモデル構築時の負荷は非常に大きくなります。このような負荷を抑えるためには次のような方法があります。

学習データのカラム数やレコード数を少なくする。
あらかじめ、数値データをカテゴリ化してテキストで置き換えておく。例えば0から9までを"S1"、10から19までを"S2"などに置き換える。

Qモデル自動構築の評価基準はどれを選ぶとよいですか？

ABayoLinkS では AIC などの情報量規準を評価関数とし、 Greedy Search アルゴリズムで各ノードに対して親を決めています。
情報量規準と呼ばれる ML(最大対数尤度), AIC, MDL については結果として得られるモデルのリンク数に次のような傾向があります。

ML > AIC > MDL

ML はリンクの本数が多く検証では精度が良いという結果となりますが、パラメータ数が多くデータに過剰にフィットしているとも考えられます。未知のデータの予測などに対しては、よりシンプルなモデルが得られるAICやMDLを使う方が一般的には良いとされています。

Q構造学習の実行中に『構造学習を中止しました（Java heap space）』というエラーメッセージが表示され、学習が失敗します

Aこれは構造学習での消費メモリが非常に多い場合に発生します。
以下を行うと、メモリの消費量をおさえ学習が可能となる場合があります。

各ノードで状態値の数をできるだけ少なくする (最大で5個くらいに絞る)
構造学習の学習アルゴリズムで "欲張り法(Greedy Search)" を使う
モデルの親子関係の設定で、必須親または親候補を制限する

推論について

Q推論時に証拠状態をダイアログで1つ1つ設定するのは困難です。まとめて設定することはできないでしょうか？

A付属のExcelアドインを利用することで複数の推論もまとめて実行することが可能です。詳しくは「Excel アドインマニュアル」をご参照ください。

Q推論を実行すると"network has cycle. not DAG."というメッセージが表示され実行できません。

Aこれはネットワークに双方向リンクまたは循環があるときに発生します。循環回避コマンドを使用するか、または手動で循環を取り除いてから推論を実行してください。

Q推論を実行すると"failed to malloc output buffers"というメッセージが表示され実行できません

Aこれは推論を実行するのに必要なメモリが確保できない場合に発生します。原因として非常に大きなサイズのCPTが存在することや、BayoLinkSの使用メモリを最大限大きくしていることが考えられます。
・関連項目
使用メモリの上限を変更したいのですが

Q 推論を実行すると以下のようなメッセージが表示されます。
cannot XML parse C:\Users\ユーザ名\Documents\BAYONET6\tmp\xxx#bif.
ただし、xxxには任意の文字列、#には番号が入ります。

A 原因としては以下が考えられます。
(1) ノード名や状態値に不正な文字コードが含まれる。 (2) モデルにサイズが非常に大きい条件付確率分布表(CPT)を持つノードがある。
(1)につきましては、ノード名と状態値の名前で使用できない文字は以下の通りです。

\ = “ : | (いずれも半角文字)

(2)につきましては、BayoLinkSの画面左のパネルに表示されますCPTにおいて、サイズが非常に大きいものがないかどうかご確認ください。
なお、CPTが大きくなる要因としては以下が挙げられます。
・親ノードを多数もつノードが存在する。
・ノードのカテゴリ(状態)の多いものを複数組み合わせて親ノードとしている。
上記に該当するノードがありましたら、親ノードを減らす、状態を減らす等の方法でCPTのサイズを小さくしていただき、再度ご実行ください。

その他の操作について

QBayoLinkS 単体機能を起動すると"Could not create the Java virtual machine"というメッセージが出ます

A起動の際、次のメッセージが表示され起動ができない場合は使用メモリの上限値が大きすぎる可能性があります。使用メモリの上限値を下げてから起動してください。なおPCの環境によっては初期設定(メモリの上限=1024MB)で起動しない場合もあります。

・関連項目
使用メモリの上限を変更したいのですが

Q使用メモリの上限を変更したいのですが

A1.BayoLinkSの設定ファイル (<bayolink install dir>\bin\BayoNet.l4j.ini) をエディタで開き、-Xmx項目を変更します。 (ファイルをでデスクトップなどにコピーしてから編集し保存します。編集したファイルを元の場所に上書きコピーをします。)
2.メモリを 1024MB に設定する場合の例
-Xmx1024m
(注意)
変更できる値の上限値はOSやPCの環境等によって異なります。

Qクロス集計表(CTT)を見たいのですが

Aクロス集計表は (Cross-Tabulation Table) を意味し、変数の各状態ごとにデータを集計した結果が格納されます。モデル構築機能では、学習データからCTTを作成しさらにそれを正規化してCPT (条件付確率表 (Conditional Probability Table)) を作成します。
CTTは、CPTタブ内の[クロス集計]を選択することにより確認できます。

QExcelの推論アドインで使用できるノード数には上限がありますか?

AExcelアドインの推論では、モデルのノード数の上限値は設定しておりません。ただし一枚のシートで説明変数と推論結果を記述するため、これらの項目の合計がExcelの列数の上限を超えてしまうと、エラーが発生します。
(列数の上限はExcel 2003の場合256個、2007及び2010の場合は16384個です。)

シートに記述する項目の列数は、以下の式で計算できます。

説明変数の個数 + 目的変数の個数 + 全目的変数の状態の和 + 2

(式最後の"2列"は、入力値と出力値の境界と、エラーメッセージの出力に使用します。)

上の式の値が、Excelの列数の上限を超えないように、説明変数や目的変数の数を調整します。または、一度に指定する目的変数を減らして、複数回に分けて推論を行います。

Q構造学習を中止しました(スレッド番号=0の計算がエラーになりました)[略]と表示されます

学習データで列の値が 1種類しかない場合に発生するエラーです
（例えば、ある列の値が全て「AAA」になっている場合）
列の値の種類数については、構造学習のウィザードの「状態数」で確認できます。

Q「NA」を含む入力データでネットワークの検証を実行するとエラーになります

ABayoLinkS では入力データのブランク(空白または空欄) を欠損値として扱います。 VAPに数値列(実数または整数)としてインポートすると、欠損は (NA) に置き換えられるため「構造学習アイコン」に入力した際、欠損として認識されなかったことが原因です。
BayoLinkS では入力データは文字列型(カテゴリ)を想定しています。数値列が含まれていても学習自体は可能ですが、欠損値は正しく扱われません。
学習データ、検証データについては数値列を離散化してカテゴリに変換するか、ファイル入力時に文字列型に指定してインポートを行ってください。

Q「利用設定がされていないかライセンスが登録されていないため実行できません。」と表示され、BayoLink Connectorのアイコンが起動できません

AWindowsのスタート→「MSI Slutions」フォルダにある「BayoLinkS ライセンスの登録・更新」ボタンを押下してください。それでも実行できない場合、以下をお試しください。

1.Visual Analytics Platform(VAP)のメニュー→「製品(P)」→「製品の選択(S)」を押下してください。
2.「製品の選択」画面において、「製品名」のBayoLink Connectorの左横の「選択」に「×」印が入っているかどうかご確認ください。

もし2.で「×」印が入っていない場合、クリックして「×」印を入れていただいた後、「適用」、「OK」ボタンを押下してください。

Q構造学習の実行スレッド数を増やす方法を教えてください

A1.BayoLinkS(単体機能)を起動してください。
2.上部のメニューから「ヘルプ」→「プロパティ」を起動してください。
3.左側の一覧から「構造学習」を選択し、右側のパネルを確認してください。
4.「マルチスレッド数を自動設定する]のチェックを外し、「学習アルゴリズムで使用するスレッド数」に任意のスレッド数を指定してください
(注) 実際にはPCの過剰負荷を避けるため、指定したスレッド数の7割程度が学習に利用されます。