-------------------------------------------------------------------
■【トピック】Text Mining Studio (TMS) 今年度の開発計画
-------------------------------------------------------------------
日増しに暖かくなってまいりました今日この頃、皆様いかが
お過ごしでしょうか。
本年度の課題としてまず検討しております点は、TMS における
英語分析機能の強化です。言語解析の高速化や精度の良い連語抽出と
いった技術的な課題をクリアして、より実用に即した機能を提供させて
いただけるよう一同開発に邁進してまいります。
近頃、TMS は論文・文献データの分析においても注目を頂けるように
なりました。この度、文献データ分析を題材として TMS の紹介記事を、
『情報の科学と技術』誌 2017年3月号 に寄稿いたしました。
内容は下記 URL からご参照ください。
http://www.msi.co.jp/tmstudio/jdream3/infosta_journal_201703.pdf
J-DreamIII 文献データの販売についてなどは下記の営業部からの
お知らせをご覧ください。
(TMS開発リーダー 岩本 圭介)
-------------------------------------------------------------------
■【技術コラム】TMSとVMSとの連係 カテゴリチェック表の活用法
-------------------------------------------------------------------
みなさま、こんにちは。
TMSチームの 中島 です。
みなさまは Visual Mining Studio (VMS) をお持ちでしょうか。
あるいはご興味をお持ちでしょうか。TMS と VMS を連係させたい、
連係させて使うことに興味があるという方へ、
今回の技術コラムでは、TMSで作成できるカテゴリチェック表を
利用した VMS との連係についてご紹介いたします。
TMS は VMS の1つのアイコンとして他の分析アイコンにつなげることが
できます。
VMS のフロー上の TMS で作成したカテゴリチェック表は VMS のほかの
分析アイコンにご利用いただけます。
以下
・VMS と TMS を連係する際の基本的な使い方について
・VMS の予測モデルとカテゴリチェック表について
を簡単にご説明いたします。
VMS と TMS の連係を行うには、VMS で「文章解析」アイコンを使います。
文章解析アイコンは
アドオン
+ Text Mining Studio
+ 文章解析
にあります。文章解析アイコンを、VMS 画面上の解析を行うための
プロジェクトボードに置きます。文章解析アイコンを実行しますと、
TMS と同じ分析画面が表示されます。文章解析は TMS と同様の分析を
行うことが可能です。
この分析画面を閉じるとき、設定の保存と結果の出力を行うかどうかを
確認するメッセージが表示されます。そこで「はい」をクリックすると、
アイコンの出力結果として TMS の分析結果が得られます。
VMS では予測モデルを構築することができます。「モデリング」と
呼ばれる機能です。VMS の上でモデリングを行うアイコンでは
「1行1件のデータ」が必要で、TMS で「グルーピング」を行った
結果のカテゴリチェック表を出力したファイルが、そのままご利用
いただけます。
カテゴリチェック表ファイルでは、グルーピングで作成した話題の列に
0 か 1 の値が入っています。原文のテキストデータがその話題を
含まないときは 0、話題を含むときは 1 が入ります。
また、カテゴリチェック表に属性の情報を付加することも可能です。
TMS 上のグルーピング結果画面の左下の「カテゴリへ→」をクリックして
表示されるカテゴリチェック表の画面の上部中央にある「属性表示」を
選択し、表示したい属性にチェックを入れると、既存の属性情報を
表示させることができます。この状態でカテゴリチェック表を
閉じますと、出力結果のカテゴリチェック表ファイルに属性の情報を
含ませることができます。
例えば属性として「性別」を表示し、「価格」と「耐久性」という
グループのそれぞれに「パケ料->タダ」「バッテリー->消耗」という
メンバが含まれている場合、TMS から出力されたカテゴリチェック表は
以下のような形をしています。
ファイルID | 行ID | 文章ID | 性別 | 価格 | 耐久性 | 原文
-----------+------+--------+------+------+--------+-------------------
1 | 1 | -1 | 女 | 1 | 0 |パケ料タダにして...
-----------+------+--------+------+------+--------+-------------------
1 | 2 | -1 | 男 | 0 | 1 |バッテリーの消耗・・・
-----------+------+--------+------+------+--------+-------------------
: | : | : | : | : | : | :
カテゴリチェック表は、テキストデータがそれぞれの話題を含むか
含まないか、属性ごとにどのような値を持つか、という情報を1行1件の
データとして持つため VMS でモデリングを行うのにとても便利な
データです。
みなさまは TMS のセミナーで紹介される、決定木を用いた口コミデータの
分析を覚えておいででしょうか。口コミサイトのレビューは一見良いこと
のみを書いてあるのに、5点満点中4点の評価になっているのはどういう
わけか、という分析です。全体のデータのうち、どの話題があればより
4点が多いのか、あるいは5点が多いのか、さらに、属性ごとにどの値が
あれば、4点あるいは5点が多いのか、を決定していきます。
体験セミナーで紹介された予測モデルは VMS の「Tree&Random Forest」を
利用することで構築できます。
TMS と VMS の基本的な連係につきましては
Text Mining Studio マニュアル
+ 17. Visual Mining Studio との連係
をご覧ください。
VMS にご興味がおありでしたら、Visual Mining Studio 体験セミナーに
ぜひお越しください。
http://www.msi.co.jp/vmstudio/seminar.html
少しでもみなさまのお役に立てれば幸いです。
その他、TMS をお使いの上でご不明な点や機能改善のご要望、また
メルマガで取り扱って欲しい話題などございましたらお気軽に
サポートまでご連絡ください。
サポート:tmstudio-support@ml.msi.co.jp
(TMS開発担当 中島 ミホ)
-------------------------------------------------------------------
☆営業部からのお知らせ☆
-------------------------------------------------------------------
◆TMSセミナー
東 京:毎月開催
http://www.msi.co.jp/tmstudio/seminar.html#regular
大 阪:6/23(金)
http://www.msi.co.jp/tmstudio/seminarOsaka.html
(名古屋は10月に開催を予定。)
◆TMSスキルアップセミナー 5/26(金) 空き席まだあります!
http://www.msi.co.jp/tmstudio/seminarSkillup.html
◆ビッグデータ活用展 5/10(水) ~ 12(金)
http://www.data-m.jp/
毎年恒例、各日ともに<AM>限定、当社ブースでの無料個別相談会受付中!
要事前予約:本メールに返信にてご希望日時をご指定のうえご連絡ください。
◆論文データ分析セミナー 6/29(木)
http://www.msi.co.jp/tmstudio/seminarArticleData
◆J-DreamIII 文献データ販売 (キャンペーン内容が新しくなりました)
http://www.msi.co.jp/tmstudio/jdream3
-------------------------------------------------------------------
メールマガジン バックナンバー
-------------------------------------------------------------------
過去のメールマガジンはこちらをご参照ください。
http://www.msi.co.jp/tmstudio/mailmagazine/index.html
ご質問等がございましたら御気軽にご相談ください。
ご連絡先Eメール:tmstudio-info@msi.co.jp
(TMS営業担当 湯淺)