VMStudio 新バージョン 8.3 をリリースいたしました!
Visual Mining Studio 8.3 の新機能をご紹介いたします。
(画像をクリックすると拡大します)
新機能一覧
新アイコン「Model Optimizer」 の追加
「Model Optimizer」アイコンは、分析自動化の一環として、最適なモデル構築に必要なアルゴリズム、パラメータ、変数選択を機械的に行う最新技術です。 分析対象データに応じて予め指定した評価基準に基づいて、交差検証を行いながら、予測精度の高いモデルを構築すると同時に、ベイズ最適化の基本原理を用いて、 探索の効率化も実現しています。

K-Means++ 機能の追加
クラスタ分析の K-Means アイコンで K-Means++ が利用できるようになりました。
K-Means++ は初期のクラスタ中心を決める際、もっとも近い他のクラスタ中心との距離が最大となるように初期クラスタ中心を決めるため、
安定した収束速度ならびに最適解が得やすくなることが知られています。
KMeans のパラメータ指定 GUI も刷新しました。

新データビューアの搭載および「データ可視化」アイコンの追加
データビューアを刷新し、より簡単にグラフを作成できるようになりました。また、異なるグラフ間で対応するデータを確認することができるため、
より深い分析も可能です。
各アイコンのデータビューアとして起動する他、データビューアを起動するアイコン「データ可視化」として利用することができます。

新アイコン「離散化」「離散化(適用)」の追加
数値データを離散化し、カテゴリデータに変換する離散化アイコンを搭載しました。これまで、等数分割しかできませんでしたが、 「離散化」アイコンを使うことで、よりバラエティに富む離散化が可能になったため、カテゴリ変数と相性の良い機械学習を有効に活用しやすくなりました。 離散化方法としては、以下の分割手法で複数の列に対して離散化を行うことができます。
- 等間隔
- 等数
- カイ二乗
- Gini 係数
- 誤判別数
- 群内二乗和
- 手動
このうち、カイ二乗・Gini 係数・誤判別数では、設定した目的変数に関してその値が最もよくなるように分割点を決めることができます。
「離散化 (適用)」アイコンは「離散化」アイコンで決定した分割点に基づいて、別データに対して同じ条件で離散化を行うことができます。

新機能一覧は pdf ファイルでもご覧いただけます。
