機能一覧
前処理
データインポート | csvファイルなどのテキスト形式のデータを取り込む |
サンプリング | ランダムサンプリングを行う |
スカッシング | BIRCHアルゴリズムでデータの圧縮を行う |
コアセット | k-meansに最適化したデータの圧縮を行う |
データハンドリング | 対話的にフィルタリング、集計などのデータ加工を行う |
分析
オンラインSVM | Multiclass Support Vector Machineで分類モデルを作成する |
オンライン線形回帰 | 線形回帰で予測モデルを作成する |
オンラインロジスティック回帰 | 多項ロジスティック回帰で分類モデルを作成する |
予測 | 作成したモデルを使用して予測を行う |
検証 | 予測値と実際の結果を比較してモデルの評価を行う |
オンラインk-means | k-meansでクラスタリングを行う |
オンライン行列分解 | 行列分解、非負値行列分解でクラスタリング、特徴抽出を行う |
レコメンデーション | オンライン行列分解の結果を使用してレコメンデーションを行う |
統計量
基本情報 | 行数、列数、最大値、最小値などの基本的な情報を表示する |
集計 | 平均、分散、最大値、最小値などの統計量を計算する 重み付き、キー付きの集計にも対応 |
その他
データ&グラフビュー | データの閲覧、グラフの作成を行う |
スクリプト | 独自のデータ処理、分析内容を記述し実行する |
バッチ処理 | あらかじめ作成した分析フローをコマンドプロンプトから実行する |
外部連係
Hadoop連係 | Hadoop上のデータの閲覧、加工、集計、取り込みを行う |
Visual Mining Studio連係 | Big Data Moduleでデータ圧縮などを行った結果に対して、Visual Mining Studioの多彩な分析アルゴリズムを適用する |
Text Mining Studio連係 | 分かち書きや辞書処理といったテキストデータ特有の処理を行って文章をデータ化し、分析を行う |
その他数理システム製品との連係 | 同一のGUI上でシームレスに連係が可能 |
Python対応
Pythonスクリプトエディタ | Big Data ModuleやVisual Mining Studioのデータを読み込み、GUI上でPythonスクリプトを記述し実行する |
Python機械学習ライブラリ | オンラインアルゴリズムを用いたPythonスクリプト用の分析ライブラリを提供 |
動作環境
対応OS | Windows 8.1 Windows 10 Windows 11 Windows Server 2012 (事前に下記をご確認ください) Windows Server 2012 R2 Windows Server 2016 Windows Server 2019 Windows Server 2022 ※64bit OSのみ(すべて日本語版のOSに限ります) |
CPU | 2GHz 以上、コア数2以上 (2.8GHz以上、コア数4以上を推奨) |
メモリ | 4GB 以上 (2GB×コア数以上を推奨) |
ストレージ | 空き容量 10GB 以上 (推奨空き容量は分析対象データサイズに依存) |
Windows Server 2012 でのご利用について
ライセンス認証のために TLS 1.2 の有効化が必要です。
有効化方法などについて詳しくは以下サポートまでお問い合わせください。
Big Data Module サポート
E-mail: vmstudio-support@ml.msi.co.jp