トップ > 機能詳細 > Text Mining Studio 分析

Text Mining Studio 分析

Text Mining Studio ( TMStudio ) は、豊富な分析機能を備えています。

各分析結果は以下のようなグラフによる表示以外にもグリッドによる表示、CSV等による書き出し、レポート出力もできます。こちらも合わせてご参照ください。

基本情報

データの総量や 1 行の平均的な単語の数、品詞の情報などのテキストに関する基本情報や、属性毎の集計など、分析を行う上でまず知っておく必要のある情報を得るための分析です。

テキスト基本情報 画面

ビジュアル集計

属性情報を様々な角度から集計・可視化することができます。キー毎の集計やクロス集計をインタラクティブに行い、その結果を豊富なグラフ表示機能により、手軽に閲覧することができます。

ビジュアル集計 画面

単語頻度解析

単語の頻度に関する情報を表示します。属性毎の集計も可能です。様々なグラフでの表現により、多くの情報を得ることができます。また、属性を 2 種類指定し、クロス集計結果を図示することができます。

単語頻度解析 画面

係り受け頻度解析

構文解析で得られた係り受けの情報を元に、係り受けの頻度情報を表示します。属性毎の集計や属性間のクロス集計も可能です。

係り受け頻度解析 画面

グルーピング

テキスト中に出現する 単語(1文節) 及び 係り受け(2文節) の係り受け表現 を抽出し、これらの表現をマウス操作で簡単にグルーピングすることができます。グルーピングの結果を他の分析で用いるためのグループ辞書機能を搭載します。類義語辞書のように用いることも可能です。


注目語情報

注目した単語が、どういった使われ方をしているのか、また他のどういった単語と同時に出てくるかといった情報を得ることができます。


特徴語抽出

属性毎に特徴的な単語を抽出します。ターゲットを絞った要求の抽出や属性別の傾向などが把握できます。

特徴語抽出 画面

特徴表現抽出

属性毎に特徴的な係り受け表現を抽出します。


評判抽出

良いイメージで語られることば、悪いイメージで語られることばを抽出します。また、抽出した単語の、原文での用いられ方を確認することができます。評価を与える語のカスタマイズを行うこともできます。

評判抽出 画面

ことばネットワーク

属性とことば、また ことば同士の関連性の強さをネットワーク図で図示します。関連性の指標として、単語同士の係り受け関係もしくは同時出現(共起)の確率を用いることができます。ネットワーク図を整理することにより、関連の強いもの同士のクラスタが見えてきます。

ことばネットワーク 画面

対応バブル分析

ことば同士の関係や、ことばと属性の関係を 2 次元上にマッピングします。頻度をバブルの大きさで表わすことにより、重要な単語との関連を一目で表します。

対応バブル分析 画面

文章分類

文章を指定のクラスタ数に分類し、各クラスタの情報をレポートします。全クラスタの属性分布と単語分布をグラフで一度に確認することが可能です。また、各クラスタを構成する代表的な単語を抽出します。

文章分類 画面

単語頻度推移

時間軸の属性を持つデータについて、その時間軸ごとの単語頻度や、出現の変化をグラフで確認できます。また、時間方向で動きの大きい単語のみを抽出する機能を持ちます。


係り受け頻度推移

係り受け関係についても、単語頻度推移と同様の抽出を行うことができます。