-----------------------------------------------------------------
■【トピック】ユーザーコンファレンスの御礼 と 今後
-----------------------------------------------------------------
今年も 11/22(金)に当社ユーザーコンファレンスを開催し、過去最多数の
ご来場者様数により、大盛況のうちに終了しました。
お陰様で毎年多数の方にご来場いただき、ユーザーの皆様における
情報共有の手段、また交流を深めて頂く場となっております。
TMS関連のご講演も8件、と多数開催され非常に活気のある場となりました。
講演をご快諾くださりましたご講演者様、学生研究奨励賞に
ご応募くださりました学生の皆様、またご来場頂きましたユーザーの皆様に
厚く御礼申し上げます。
現在、TMSチームは2014年度初旬に予定しております製品バージョンアップに
向けて励んでおります。こちらに関しましては、今月12/25(水) 予定の
『新バージョン発表会 2013』にて詳細情報をお伝えさせて頂きたく
存じます。
皆様のご来社をお待ちしております。
何卒よろしくお願い申し上げます。
(TMS開発リーダー 岩本 圭介)
-----------------------------------------------------------------
■【技術コラム】文章分類 ~単語使用状況の数値の活用法~
-----------------------------------------------------------------
みなさま、初めまして。
2013年度からTMSチームのメンバーに入りました、尾崎 博子と申します。
これからTMSの開発にバリバリ携わっていきたいと思います。
よろしくお願い致します。
さて、今回は「文章分類の表の見方」についてご紹介します。
文章分類の分析の結果には、
結果サマリ、 属性情報、 単語使用状況
という3つのタブがございますが、その中でも今回は
単語使用状況
に注目したいと思います。
「単語使用状況」のタブを選択して頂きますと、各クラスタについて
単語ごとの使用状況が折れ線グラフで表示されるかと思います。タブ名の
すぐ下にいくつかのメニューがございますが、その中の一番左の
グリッドを表示
というアイコンをクリックして頂くと、折れ線グラフを描画するのに
使用したデータの表が表示されます。(マニュアルの「13.3.1. グリッド
(表)を表示する」にも記載されております。)
例えば、以下のような表が表示されたとしましょう。
単語 | 品詞 | 品詞詳細 | No1. 日本 | …
===================================
地図 | 名詞 | ○○○○ | 0.050 | …
-----------------------------------
この表の数値、0.050 は何を表しているのでしょうか。
実はこの数値は
クラスタ内のデータで、その単語が出現する割合
を表しています。
つまり、上記の例で言いますと、「"No.1 日本"クラスタの中で
"地図"という単語が出てくるデータの割合は 約5% である」
ということです。もし、数値が 1 であればその単語は分類されたクラスタの
データ全てに出現する、ということになります。
これは文章分類内部の処理に起因します。
TMSの文章分類のデフォルトの設定では、各テキスト行について分類に
使用する単語が出現しているか/していないか、を調べ、出現していれば1、
出現していなければ0を付与した特徴ベクトルを作成します。そして、
このベクトルを使用し K-means法 で分類を行っています。
そして、各クラスタに分類されたデータの中心の値が今回紹介しました
「単語使用状況」の表の数値となっています。この数値は単語の出現割合を
表しているため、次のような活用ができます。
例えば、上記の例で "No.1 日本" クラスタに属するデータが 40 件で
あったとすると、
40 × 0.050 = 2
つまり"地図"という単語が出現するデータは"No1. 日本"に2件ある、と
いうことがわかります。このように、表の数値からクラスタ内で対象単語が
出現するデータの件数が計算できます。(各クラスタに属するデータの
件数は「結果サマリ」タブの表をご覧ください)
以上ご参考になれば幸いでございます。
(NTTデータ数理システム TMS開発担当 尾崎 博子)
-----------------------------------------------------------------
☆営業部からのお知らせ☆
-----------------------------------------------------------------
【TMSセミナーのお知らせ】
毎月開催!
http://www.msi.co.jp/tmstudio/seminarRegular.html
■特許セミナー:12/10(火)
招待講演:正林国際特許商標事務所様
http://www.msi.co.jp/tmstudio/seminarSpecial_20131210.html
■"福岡"にて初開催! TMS体験セミナー:12/12(木)
http://www.msi.co.jp/tmstudio/seminarFukuoka.html
□コールセンターセミナー開催(上記当日、同場所にて)
招待講演:TOTO株式会社様
http://www.msi.co.jp/tmstudio/seminarCallCenter.html
【その他イベント】
■看護科学学会出展 12/6(金)、7(土)
@大阪国際会議場(12Fホワイエ)
■バージョンアップ発表会 12/25(水)
http://www.msi.co.jp/packages/new_version_2013.html
-----------------------------------------------------------------
メールマガジン バックナンバー
-----------------------------------------------------------------
過去のメールマガジンはこちらをご参照ください。
http://www.msi.co.jp/tmstudio/mailmagazine/index.html
ご質問等がございましたら御気軽にご相談ください。
ご連絡先Eメール:tmstudio-info@ml.msi.co.jp
今後とも何卒よろしくお願い致します。
(TMS営業担当 湯淺 麻紀子)