機能詳細

Visual Mining Studio は簡単な操作で本格的なデータマイニングが行えるツールです。

データの前処理から、マイニング処理、他アプリケーションとの連係機能を備え、さらにその結果をグラフィカルな表示で表現することができます。

データ操作機能

データの欠損値の補完からフィルタリングなど、分析を行う前の加工をスムーズに、便利に行うための各種機能を搭載しております。

機能	簡単な説明
クリーニング	欠損値・外れ値の検出／補完を行う
グルーピング	数値列のカテゴリ化／文字列のグループ化を行う
サンプリング	データの一部を一定間隔／ランダムで抽出する
ソート	キー列ごとに昇順／降順で並べ替える
ファイル分割	指定した比率で学習／検証用データに分割する
フィルタリング	指定した条件に合う行を抽出する
マージ	行方向結合／列方向結合を行う
列属性変更	列名と列の属性変更／数量化を行う
正規化	規格化／標準化（標準偏差／平均偏差）／対数変換を行う
層別サンプリング	キー列の値または条件毎に行数／割合を指定しデータを抽出する
匿名化	データを加工して匿名にする
再配置	テーブルのデータを再配置（転置／横展開／リスト化／列順変更）する
データハンドリング	データを加工しながらインタラクティブに可視化する
日付時刻処理	日付データに関する計算、処理を行う
行選択	設定した条件に該当する行を抽出する。複数のテーブルを1度に抽出できる
日付選択	指定した日付に関する条件に該当する行を抽出する
集計	項目別カウント、統計量（合計／平均／分散／最大／最小など）を求める
パラメータ毎実行	フロー上のアイコンのパラメータを設定し、パラメータの全組合せを実行

▲topへ

データ探索機能

データから知識・規則性を見つけ出すための分析機能を備えています。

前処理

機能	簡単な説明
時系列処理（基本操作）	時系列データに関する統計量と推移列を表示する
時系列処理（線分表現）	時系列データを複数の直線で近似表現する
時系列処理（計算距離）	時系列データがあるパターンに合う/合わない部分を抽出する
欠損補填	K-Means-EM法を用いた欠損補填

集計

機能	簡単な説明
集計（Aggregate）	キー付き、変数毎に統計量（合計／平均／分散／最大／最小など）を求める。重み付き集計も可能
相関	相関係数／χ²値／F値を計算する
フィーチャーセレクション（Feature Selection）	目的変数に対して有効な説明変数を探す
群間比較	データを複数の群に分割して、群の特徴を自動的に抽出する
RFM分析	顧客の購入履歴から優良顧客と判断するための分析を行う
ビジュアル集計	入力を対話的に加工しながら、集計とグラフの作成を行う

分類分析

機能	簡単な説明
隠れセミマルコフモデル（HSMM）	時系列が、観測されていない内部状態から生成されると仮定し、時系列を表現するモデルを作成
対話型モデル	Active Learning手法により、大量のデータに人手で教師値を付与する作業を効率化し、少ない労力でより予測精度の高い分類器を構築
Model Optimizer	最適なモデル構築に必要なアルゴリズム、パラメータ、変数を自動探索
ディシジョンツリー（決定木、回帰木、Decision Tree）	多分岐の回帰木、分類木を作成する。欠損値にも対応。ユーザ対話型
ランダムフォレスト（Random Forest）	ランダムフォレストモデルを作成する
k-NN分析	k個の近傍データから回帰モデル、判別モデルを作成する
Neural Network	階層型 Network を用いて回帰モデル、判別モデルを作成する
Radial Basis Function Network	中間層の Gauss 関数を用いて、回帰モデル・判別モデルを作成する
サポートベクターマシン（Support Vector Machine）	サポートベクターを用い、回帰モデル・判別モデルを作成する
nuSVM	サポートベクター数を制御可能な Support Vector Machine
サポートボールマシン（Support Ball Machine）	クラスタリングによるデータ圧縮と、Support Vector Machine を組み合わせた判別モデルを作成。大規模データに有効
予測	モデルの評価、適用を行う
ルールベース予測	学習データから抽出したルールを未知のデータに適用して予測を行う
モデル統合	複数モデル間の重みを最適化し、集団学習を行う
ナイーブベイズ（Naive Bayes）	説明変数間の依存性を考慮した Naive Bayes で判別分析を行う
交差検証	異なるデータを用いて繰り返し学習し、最適なモデルを探し出す
ブースティング（Boosting）	多数のモデルを統合し、高精度なモデルを作成する
Bagging	複数のモデルの多数決により、過学習に強いモデルを作成する

クラスタ分析

機能	簡単な説明
BIRCH	データを圧縮し、圧縮されたデータに対して K-Means 法を行う
K-Means法	データを指定した k 個のクラスタに分解する
OPTICS	データの密度を元にクラスタを抽出する。特殊な形状のクラスタも抽出可能
自己組織化マップ（SOM）	Neural Network を用いてデータを2次元平面へマッピングする
ネットワーク階層化	ノードのリンク情報を用いて階層型クラスタリングをする
One-Class SVM	サポートベクターを用いて外れ値の検出を行う
One-Class SVM 判定	One-Class SVM の外れ値判定モデルを用いて、新規データの外れ値判定を行う
Isolation Forest	分岐点をランダムに決める、複数分離木から算出し、外れ値の検出を行う
Isolation Forest 判定	Isolation Forest の外れ値判定モデルを用いて、新規データの外れ値判定を行う
異常検知Forest	Ranodom Forest の手法を応用して異常検知を行う
異常検知Forest 判定	異常検知Forest の外れ値判定モデルを用いて、新規データの外れ値判定を行う
階層型クラスタリング	階層型クラスタリングを行い、デンドログラムを描画する
Cluster Validation	クラスタリングの結果の評価を行う
二項ソフトクラスタリング（Dyadic Soft Clustering）	二つの項目間を隠れ変数を通じてマッチングする

アソシエーション分析

機能	簡単な説明
アソシエーション分析	多階層間アソシエーションルール（「前提＝＞結論」）を抽出する
インタラクティブルール分析	アソシエーションルールの結論を指定し、前提を対話的に探索する
関連性ダイアグラム分析	指定したアイテム間の関連性を探索する
時系列アソシエーション分析	時間的に順序のあるアソシエーションルールを探索する
クラスアソシエーション	結論となる列を指定したアソシエーション分析

多変量解析

機能	簡単な説明
対応分析（correspondence analysis）	カテゴリデータを数量化し、主成分分析する
主成分分析（principal analysis）	多変量データの持つ情報を、少数個の因子に要約する
Kernel 主成分分析	カーネル法を用いた主成分分析を行う
主成分分析得点	主成分分析、Kernel主成分分析で作成したモデルから新規データの判定を行う

▲topへ

その他の機能

他アプリケーションとの連係機能を搭載しております。

機能	簡単な説明
スクリプト	固有のスクリプトを用いて、細かな操作を定義する
R連係	アイコンで対話的に R の統計機能を実行する。また、スクリプトによる連係も可能
S-PLUS 連係	データ解析ソフト S-PLUS 固有の統計関数、グラフィックス機能を実行する
外部接続	外部のスクリプトを VMStudio 上から実行する。R,SAS,Matlab,Perl に対応
データベース連係	各種のデータベース（Oracle，DB2，Access 等，ODBC 接続可能なもの）と連係する
バッチ処理	事前に作成した処理フローを外部から実行する
Excel連係	Excel シートから VMStudio の処理フローを実行して結果の取得が可能
ピボットテーブル作成	集計結果を Excel のピボットテーブルとして出力する
テキスト整形	テキストデータの構造を整え、データ入力を円滑に行う
レポーティング機能	プロジェクトの内容を HTML 形式のレポートに出力する
Big Data Module との連係	大規模なデータ分析対応
Visual Mining eXpress	Webブラウザ上で、マウス中心の操作でデータの分析を行う
Visual Analytics Platform WEB Server	Visual Mining eXpressと同様の分析メニューを作成する

データベース連係は、株式会社アシスト様の DataDirect Connect for ODBC による高速接続も可能です。

新機能

Visual Mining Studio の最新バージョンは 9.0 です。
新規ライセンス認証システムの導入、軽微な不具合修正を行いました。

▲topへ