-----------------------------------------------------------------
■【トピック】Text Mining Studio(TMS) 今後の開発計画
-----------------------------------------------------------------
TMS バージョン5.1 のリリースから 約2ヶ月 が経ちました。
今後は、「簡単操作の単語集計ツール」としてリリースいたしました
新機能「Text Mining eXpress (TMX)」の部分に、皆様のご利用状況に
合わせて更なる機能追加を行いたい所存でございます。
また、各製品間の連係によるソリューションのご提案にもより力を入れて
おります。お気軽にご相談ください。
何卒宜しくお願い申し上げます。
★今年も大阪でのセミナ開催日が決定しました!
(詳細は下記、"営業部からのお知らせ"をご覧ください)
(TMS開発リーダー 岩本 圭介)
-----------------------------------------------------------------
■【技術コラム】アスタリスク(*)の活用法
-----------------------------------------------------------------
皆さま、こんにちは。TMSチームの古賀と申します。
さて今回は、半角アスタリスク(*)の活用法についてご紹介したいと
思います。
TMS では、様々な入力場面でアスタリスク(以下 *)を任意の文字列を表す
記号(一般的にワイルドカードなどと呼ばれています)として利用できます。
例えば、製品型番として A012、A123、... と A で始まる単語が
見受けられ、それらを「Aシリーズ」としてまとめたい場合、類義語辞書に
下記のように設定しておけば、A012、A123 などの数値部分をまとめて
類義語として登録できます。
代表語: Aシリーズ
品詞: 名詞 一般
類義語: A*
また、以下のように * を前に置くこともできます。
代表語: 病院名
品詞: 名詞 一般
類義語: *病院
類義語: *医院
類義語: *クリニック
このように「*」を使うことで分析の幅が広がります。今回はこのような
TMS で「*」が使える箇所をまとめてみました。また、その中からいくつか
代表的な使用法について見てみたいと思います。
~ * が使える箇所まとめ ~
(入力の際は、半角アスタリスク'*'をご利用ください。)
1) 類義語辞書 (類義語側に * を使う)
上記の「Aシリーズ」の例のような使用方法です。
2) 類義語辞書 (代表語側に * を使う)
一括で品詞の設定ができます。例えば以下のように設定します。
代表語: *
品詞: 記号 一般
類義語: 携帯
類義語: 機能
以前メルマガ(バックナンバー Vol.5 2012年10月30日発行)でも
ご紹介させて頂きました。
以下の URL からご覧頂けます。
( ユーザ名 : tms , パスワード : msi )
http://www.msi.co.jp/tmstudio/mailmagazine/backnumberVol5_20121030.html
3) 分割辞書
左側 | 右側
* | 料金
のように * を使うことができます。右側に * を置くこともできます。
4) 属性加工
文字列属性加工で、
集約後の属性値
2013年
集約前の属性値
2013年*
と指定することで、例えば「2013年5月」のような表現を「2013年」に
まとめあげます。
以前メルマガ(バックナンバー Vol.9 2013年09月02日発行)でも
ご紹介させて頂きました。
以下の URL からご覧頂けます。
( ユーザ名 : tms , パスワード : msi )
http://www.msi.co.jp/tmstudio/mailmagazine/backnumberVol9_20130902.html
5) カテゴリデータ作成ツール、グルーピング
カテゴリデータ作成ツールは下記手順にて開くことができ、ルール編集
画面の要素1、要素2、要素3で * を利用できます。
・ TMS のメニューの [前処理]->[カテゴリ生成]
・ ことばネットワークの結果の「再設定と再実行」横の
「カテゴリルール」
同様に、TMSの分析「グルーピング」でも実行結果のグループ欄の要素1、
要素2、要素3で * を利用できます。
これら、要素1、要素2、要素3欄は * 以外にも、係り受け記号「->」、
述語属性記号「+」、否定記号「!」を入力できます。
グルーピングでは要素入力欄でマウスをクリックしたときに出現する
左の▲マークを押し、ハイライト表示状態にしたときに、右クリック
メニュー「あいまい指定」、「否定」、「すべての述語属性」を
選択することができますが、これらは * などの上記記号の入力支援を
行います。
グルーピングの指定方法については、
以前メルマガ(バックナンバー Vol.6 2013年02月06日発行)でもご紹介
させて頂きました。
以下の URL からご覧頂けます。
( ユーザ名 : tms , パスワード : msi )
http://www.msi.co.jp/tmstudio/mailmagazine/backnumberVol6_20130206.html
6) 原文参照の「テキスト」タブ
係り受け記号「->」、述語属性記号「+」と共に * も利用できます。
テキスト欄に入力後、「検索」ボタンを押して検索します。
例えば、「操作*->*+ない」などの入力ができます。
(keitai.csv では「操作方法がわからない」という文章が検索できます)
ここまでは TMS で作成される単語や係り受けについての操作が主でしたが、
ここからはさらに詳細なパターンマッチング、正規表現の一部として * が
利用できる機能をご紹介します。
7) 情報保護
入力データ設定ダイアログ左下の「情報保護へ」ボタン->個人情報保護
ダイアログの実行ボタン->保護設定ダイアログのその他欄の正規表現で
* が利用できます。
例えば、正規表現を利用することで製品型番をより詳細に分別するなど
複雑な変換を行うことができます。
8) TMX
TMS の[ツール]->[TMX] で起動できる TMX に「単語」と書かれた
入力欄の横の検索方法指定欄で「正規表現」を指定した際に * を
使用できます。
例: [ア-ン]*ン$
カタカナ文字で最後が「ン」で終わるもの
最後にご紹介する * の使い方は、TMS への入力ファイル渡しの時の
利用方法です。
9) TMS バッチ実行時の入力ファイル指定
TMS はバッチ実行を行うことができます。バッチ実行時は、TMS
プロジェクトを作成したときに使用したデータとは違うデータを
指定することができますが、その際 * を利用して複数ファイルを取り
込むことができます。
これまでのメルマガの内容も合わせてご紹介もさせて頂き、「*」 の利用
シーンについて確認してみました。いくつかの項目については今後の
メルマガで取り上げるなどして、より詳細に利用方法をご紹介して
いきたいと思います。
皆様のご活用のヒントになれば幸いです。
(TMS開発担当 古賀 久芳)
-----------------------------------------------------------------
☆営業部からのお知らせ☆
-----------------------------------------------------------------
【TMSセミナーのお知らせ】
・毎月開催!体験セミナー
http://www.msi.co.jp/tmstudio/seminarRegular.html
★大阪;6/26(金) 開催!詳細は、上記サイトをご覧ください
・スキルアップセミナー: 6/12(金)
http://www.msi.co.jp/tmstudio/seminarSkillup.html
【その他イベント】
・文系マーケターのためのマーケティング・リサーチ講座 4/15(水)
(TMS紹介&講演予定)
http://event.shoeisha.jp/mza/20150415/
・ビッグデータ活用展 5/13(水)~15日(金)
http://www.data-m.jp/haru/
当社ブースでの無料個別相談会受付中!
お申込宛先:tmstudio-info@msi.co.jp
タイトルに「ビッグデータ活用展 5/○(○) ○時個別相談希望」
と記載のうえ、ご送信ください。
【セミナ―へのご要望】
皆さまのご意見にお応えして、特許セミナー、コールセンターセミナーなど
随時開催しております。
ご希望のジャンル、開催地などがございましたら検討致しますので
ご一報ください。
-----------------------------------------------------------------
メールマガジン バックナンバー
-----------------------------------------------------------------
過去のメールマガジンはこちら:
http://www.msi.co.jp/tmstudio/mailmagazine/index.html
( ユーザ名 : tms , パスワード : msi )
ご質問等がございましたら御気軽にご相談ください。
ご連絡先Eメール:tmstudio-info@msi.co.jp
今後とも何卒よろしくお願い致します。
(TMS営業担当 湯淺)