-------------------------------------------------------------------
■【トピック】TMSデモムービーのリニューアルとコンファレンス 告知
-------------------------------------------------------------------
8月・9月 に開催いたしました アカデミックセミナー および
製造セミナー には、多数のお客様のご参加を賜りまして
誠に感謝申し上げます。
また今年も、例年大盛況を頂いております ユーザーコンファレンスを
11/20(金) に開催いたします。(詳細は下記、"営業部からのお知らせ"を
ご覧ください。)
【デモムービー】
この度、TMSデモムービーを大幅刷新を行いました!
詳細:TMSトップページ( http://www.msi.co.jp/tmstudio/)
の、画面左上「デモムービー」はこちらからをクリックして、
是非ご閲覧ください。
【読本】
テキストマイニングに関する読み物
「テキストマイニング読本 第二版」の一部内容公開を開始いたしました。
http://www.msi.co.jp/tmstudio/books.html#dokuhon
上記ページより閲覧が可能です。
(読本の発送をご希望の方は申請方法を上記サイトにてご確認ください。)
-------------------------------------------------------------------
■【技術コラム】辞書の仕組み
-------------------------------------------------------------------
皆さま、こんにちは。TMS チームの花島と申します。
TMS の辞書はお使いでしょうか?
今回は「辞書が分かち書きにどう影響するのか」の基本的な動作について
の話を致します。
TMS には以下の三つの辞書があります。
□単語の切れ目を変えるために用いる辞書
・ユーザ辞書
・分割辞書
□類義語をまとめ上げる辞書
・類義語辞書
この中で、ユーザ辞書と分割辞書はどのように使い分ければ良いので
しょうか?
以下の例文
Text Mining Studioはテキストマイニングツールである。
を例にとって、まずは辞書の設定が無い状態で、どのように単語の
切れ目が決定されるのかを見てみます。
以下は「分かち書きと係り受けと自動連結」で実行した場合の処理です。
1. テキストを「意味を持つ最小単位(形態素)」まで切る。
Text / / Mining / / Studio / は /
テキストマイニング / ツール / で / ある。
2. 係り受け関係を抽出し、助詞などの付属語を前の語に連結する。
Text / / Mining / / Studioは /
テキストマイニング / ツールで / ある。
3. 係り受け関係や品詞から、複合語を抽出して連結する。
Text / Mining / Studioは /
テキストマイニングツールである。
上記の中でユーザ辞書は
1. テキストを「意味を持つ最小単位(形態素)」まで切る。
際に影響します。
TMSの分かち書きエンジンは、なるべくユーザ辞書に登録された単語が
「意味を持つ最小単位(形態素)になるように」します。
例えばユーザ辞書に
Text Mining Studio | 名詞 一般
を登録すると、なるべく「Text Mining Studio」を「意味を持つ最小単位
(形態素)」とするように単語の切れ目が決められますので、1. の
結果が以下のように変わります。
ユーザ辞書利用前:
Text / / Mining / / Studio / は /
テキストマイニング / ツール / で / ある。
ユーザ辞書利用後:
Text Mining Studio / は /
テキストマイニング / ツール / で / ある。
ただし、登録された語が文脈上 1 語である確率が低いと分かち書き
エンジンに判断された場合は効きません。
分割辞書は、
3. 係り受け関係や品詞から、複合語を抽出して連結する。
処理の際に、登録された内容に応じて「連結しないように」します。
例えば分割辞書に
テキストマイニング | ツール
と登録すると、3. の結果は以下のように変わります。
分割辞書利用前:
Text / Mining / Studioは /
テキストマイニングツールである。
分割辞書利用後:
Text / Mining / Studioは /
テキストマイニング / ツールである。
一方、分割辞書は実際には「連結しないように」しているだけなので、
1. の処理で決定された「意味を持つ最小単位(形態素)」より細かく
分割することはできません。今回の例文では「テキストマイニング」が
形態素なので「テキスト」と「マイニング」には分割できません。
簡単にまとめますと、
「ユーザ辞書」は意味を持つ最小単位(形態素)を決定する際に加味され、
「分割辞書」は形態素から複合語へと結合する際に影響します。
最後に、実は分かち書きの設定画面にある「分かち書きの種類」で
分かち書きのみ
を選択いたしますと、1. の結果が出力されます。
よって、思うように単語が分かれない場合は、「分かち書きのみ」で
分かち書きをした結果を確認し、「ユーザ辞書」で形態素に
できていないのか、それとも「分割辞書」で複合語に結合しないようにする
処理が働いていないのかを確認することができます。
辞書の動作を確認する際、よろしければ是非お試し下さい。
※過去の技術コラムでも辞書の便利な使い方や発展的な使い方を
ご紹介しております。併せてご覧下さい。
Vol.5 2012年10月30日発行
新機能紹介 ~ 一括品詞設定 ~
Vol.7 2013年04月19日発行
特許情報分析のヒント:専門用語の抽出 基礎編
Vol.8 2013年06月13日発行
専門用語の抽出 応用編
Vol.13 2014年10月07日発行
連語英単語をユーザ辞書に登録
※過去の技術コラムは下記サイトにてご確認頂くことができます。
URL:http://www.msi.co.jp/tmstudio/mailmagazine
ユーザー名:tms
パスワード:msi
(TMS開発担当 花島 空)
-------------------------------------------------------------------
☆営業部からのお知らせ☆
-------------------------------------------------------------------
■ユーザーコンファレンス 11/20(金)
http://www.msi.co.jp/userconf/2015/
■製造セミナー(名古屋にて初開催!)
12/8 (火) http://www.msi.co.jp/tmstudio/seminarManufactureNagoya.html
■TMSセミナー
大阪:11/17(火) http://www.msi.co.jp/tmstudio/seminarOsaka.html
名古屋:12/9(水) http://www.msi.co.jp/tmstudio/seminarNagoya.html
東京:毎月開催 http://www.msi.co.jp/tmstudio/seminar.html#regular
■TMSスキルアップセミナー
11/18 (水) http://www.msi.co.jp/tmstudio/seminarSkillup.html
是非前日開催の、TMSセミナーと連日続けてお越しくださいませ。
■特許情報分析セミナー
10/28(水) 30(金)
タイトル:「ビッグデータを用いた特許調査解析コンサル」
場所等詳細:
http://www.smart-japan.jp/To-Visit_Aki/Exhibitors-Product-Technology-Seminar
ご講演:正林国際特許商標事務所様
TMSを用いたコンサルティングを手掛けていらっしゃいます。
(参考資料 http://www.msi.co.jp/userconf/2014/pdf/muc14_THB_3.pdf)
■特許情報分析に関する個別相談会開催!
日時:11/4(水)、5(木)、10:00~,11,30~の時間帯
無料相談:4組様限定 完全予約制!
ご希望の方は、返信にてご連絡ください。
場所:特許情報フェアでの当社出展ブース。
フェアの場所など詳細:http://www.pifc.jp/
■文系マーケターのためのマーケティング・リサーチ講座
11/26(木)
場所:翔泳社 セミナールーム
申込等詳細:http://event.shoeisha.jp/mza/20151126/
-------------------------------------------------------------------
メールマガジン バックナンバー
-------------------------------------------------------------------
過去のメールマガジンはこちらをご参照ください。
http://www.msi.co.jp/tmstudio/mailmagazine/index.html
ご質問等がございましたら御気軽にご相談ください。
ご連絡先Eメール:tmstudio-info@msi.co.jp
今後とも何卒よろしくお願い致します。
(TMS営業担当 湯淺)