ビッグデータ分析ツール Big Data Module 製品紹介

このサイトは JavaScript を使用しています。お使いの環境では JavaScript が OFF になっているため、一部のコンテンツが正常に動作しない可能性があります。

トップ > 製品紹介

機能一覧

動作環境

機能一覧

前処理

データインポート	csvファイルなどのテキスト形式のデータを取り込む
サンプリング	ランダムサンプリングを行う
スカッシング	BIRCHアルゴリズムでデータの圧縮を行う
コアセット	k-meansに最適化したデータの圧縮を行う
データハンドリング	対話的にフィルタリング、集計などのデータ加工を行う

分析

オンラインSVM	Multiclass Support Vector Machineで分類モデルを作成する
オンライン線形回帰	線形回帰で予測モデルを作成する
オンラインロジスティック回帰	多項ロジスティック回帰で分類モデルを作成する
予測	作成したモデルを使用して予測を行う
検証	予測値と実際の結果を比較してモデルの評価を行う
オンラインk-means	k-meansでクラスタリングを行う
オンライン行列分解	行列分解、非負値行列分解でクラスタリング、特徴抽出を行う
レコメンデーション	オンライン行列分解の結果を使用してレコメンデーションを行う

統計量

基本情報	行数、列数、最大値、最小値などの基本的な情報を表示する
集計	平均、分散、最大値、最小値などの統計量を計算する重み付き、キー付きの集計にも対応

その他

データ&グラフビュー	データの閲覧、グラフの作成を行う
スクリプト	独自のデータ処理、分析内容を記述し実行する
バッチ処理	あらかじめ作成した分析フローをコマンドプロンプトから実行する

外部連係

Hadoop連係	Hadoop上のデータの閲覧、加工、集計、取り込みを行う
Visual Mining Studio連係	Big Data Moduleでデータ圧縮などを行った結果に対して、Visual Mining Studioの多彩な分析アルゴリズムを適用する
Text Mining Studio連係	分かち書きや辞書処理といったテキストデータ特有の処理を行って文章をデータ化し、分析を行う
その他数理システム製品との連係	同一のGUI上でシームレスに連係が可能

Python対応

Pythonスクリプトエディタ	Big Data ModuleやVisual Mining Studioのデータを読み込み、GUI上でPythonスクリプトを記述し実行する
Python機械学習ライブラリ	オンラインアルゴリズムを用いたPythonスクリプト用の分析ライブラリを提供

動作環境

対応OS	Windows 8.1 Windows 10 Windows 11 Windows Server 2012　(事前に下記をご確認ください） Windows Server 2012 R2 Windows Server 2016 Windows Server 2019 Windows Server 2022 ※64bit OSのみ（すべて日本語版のOSに限ります）
CPU	2GHz 以上、コア数2以上 (2.8GHz以上、コア数4以上を推奨)
メモリ	4GB 以上 (2GB×コア数以上を推奨)
ストレージ	空き容量 10GB 以上 (推奨空き容量は分析対象データサイズに依存)

※推奨環境は目安です。データサイズ、分析内容によって処理時間とハードウェア要件は大きく異なります。お気軽にご相談ください。

Windows Server 2012 でのご利用について

ライセンス認証のために TLS 1.2 の有効化が必要です。
有効化方法などについて詳しくは以下サポートまでお問い合わせください。

Big Data Module サポート
E-mail: vmstudio-support@ml.msi.co.jp