-------------------------------------------------------------------
■【トピック】Text Mining Studio Webinar のご案内
-------------------------------------------------------------------
梅雨明けが待たれる毎日、いかがお過ごしでしょうか。
新型コロナウイルスに関しても予断を許さない状況が続いておりますが、
皆様におかれましてもご自愛のほど心よりお祈り申し上げます。
この状況下においても皆様からは TMS のご質問などサポートにいただいており、
大変ありがたい限りでございます。
4月からは TMS 体験セミナーをオンラインセミナー(Webinar)
として開催しております。90分のセミナーにまとめておりますので、
復習などに是非お役立てください。
https://www.msi.co.jp/event/
今後も Webinar コンテンツの拡張を予定しております。
当社でもテレワーク主体で勤務しておりますが、皆様の分析のお役に立てるツール
をご提供できますよう、これまで同様開発を行っております。次期リリースでは
アドオンの新機能をリリースする予定でおります。
次回メルマガにて詳細をお伝えできることを励みに一同開発に邁進してまいります。
今後とも TMS ならびに当社製品をどうぞよろしくお願い申し上げます。
(TMS担当 主任研究員 古賀 久芳)
-------------------------------------------------------------------
■【技術コラム】共起関係の強さとは?
-------------------------------------------------------------------
みなさまこんにちは。TMSチームの中島です。
今回は、TMSのことばネットワーク分析や注目語情報分析で抽出される
ことばの共起関係の強さについてご紹介いたします。
共起関係についての概要および矢印の向き、解釈の方法については
過去のメルマガでご紹介しておりますので合わせてご参照ください。
【技術コラム】ことばネットワークの「共起」とは
https://www.msi.co.jp/tmstudio/mailmagazine/backnumberVol2_20120105.html
上記分析では、共起関係の強いことば同士を矢印でつなぎネットワーク図を描画
しますが、この「共起関係の強さ」は何をもって強いとされるのでしょうか。
■ 共起の強さの根拠となる数値
TMSでは共起の強さとして、以下の2つの指標を用いています。
共起ルール数:
単語Aと単語Bが同じ行または文章に出現した件数。
信頼度:
ある単語Aが出現した行または文章において、別の単語Bが出現した割合。
このとき単語Aを「前提単語」、単語Bを「結論単語」といい、
単語A(前提単語) から 単語B(結論単語) へ矢印がひかれる。
例えば、以下のような文章があったとします。
1: 晴れなので買い物に行きます。
2: 買い物に行きたいから晴れになってほしい。
3: 雨でも買い物行かなきゃ。
4: 買い物に行きたいけど雨。
5: 晴れの日はお出かけしたい。
上記において、「買い物」と「晴れ」について見てみましょう。
「買い物」と「晴れ」は共起関係にある(同時に出現している)ので、
「買い物」と「晴れ」をつなぐ矢印の候補は
買い物⇒晴れ
晴れ⇒買い物
が考えられます。
共起ルール数、信頼度は次のように求められます。
「買い物」と「晴れ」が同時に出現している回数は 2 なので
買い物⇒晴れ の共起ルール数は 2
晴れ⇒買い物 の共起ルール数は 2
「買い物」が 4 回出現している中で「晴れ」が同時に出現しているのは 2 回
なので、
買い物⇒晴れ の信頼度は 2/4 = 50%
「晴れ」が 3 回出現している中で「買い物」が同時に出現しているのは 2 回
なので、
晴れ⇒買い物 の信頼度は 2/3 = 66.6%
ネットワーク図であらわす際には、共起ルール数と信頼度を用いて、
・ことば同士を矢印でつなぐかどうか
・矢印でつなぐ場合どちら向きの矢印か
・矢印の太さをどうするか
を決定します。
■ ネットワーク図を描画する ~矢印の向きの決定
共起抽出設定で以下のように設定されていた場合、上記の例で考えた
「買い物」と「晴れ」はどのようにあらわされるでしょうか。
出現回数:2回以上
最低信頼度:60%
共起ルール数は 2 なので、買い物⇒晴れ と 晴れ⇒買い物 はともに条件を
満たします。
信頼度については、買い物⇒晴れ の信頼度は 60% を超えないため条件を
満たしませんが、晴れ⇒買い物 の関係は信頼度 60% 以上であるため、
条件を満たします。
したがって、表示されるネットワーク図では、矢印は
晴れ⇒買い物
の一方向のみに引かれます。
【問題】「晴れになったら買い物に行くよ!」という 1文 が追加された場合、
「買い物」と「晴れ」矢印はどのようにひかれるでしょうか。
(※ 回答は本コラムの最後に!)
■ ネットワーク図を描画する ~矢印の太さの違い
「買い物」と「雨」について見てみましょう。
「買い物」と「雨」の共起ルール数 2
買い物⇒雨 の信頼度 2/4 = 50%
雨⇒買い物 の信頼度 2/2 = 100%
晴れ⇒買い物 と同様に 雨⇒買い物 へ矢印がひかれますが、ここでは
晴れ⇒買い物 の信頼度 < 雨⇒買い物 の信頼度
となるため、信頼度の大きい 雨⇒買い物 の矢印が太く描画されます。
上記は単語に限定して共起ルール数、信頼度についてご紹介いたしましたが、
ことばネットワークや注目語情報を実行する際に、属性を合わせて設定する
ことで属性と単語の共起関係も抽出することができます。
以上、ご参考いただけましたら幸いでございます。
TMSをご利用の上で、ご不明点や機能改善のご要望などございましたら、
サポートまでお気軽にご連絡ください。
サポート: vmstudio-support@ml.msi.co.jp
(TMS開発担当 中島 ミホ)
※ 問題の回答
「晴れ」と「買い物」が共起している1文が追加されたので、
共起ルール数は 3 となり出現回数の条件を満たします。
信頼度はそれぞれ
買い物 ⇒ 晴れ の信頼度は 3/5 = 60%
晴れ ⇒ 買い物 の信頼度は 3/4 = 75%
となり、どちらの矢印の向きでも、信頼度の条件を満たします。
よってネットワーク図の矢印は 買い物⇔晴れ とあらわされます。
-----------------------------------------------------------------
☆営業部からのお知らせ☆
-----------------------------------------------------------------
Text Mining Studio営業担当の岩田でございます。
ことばネットワークは、TMSをお客様に初めてご紹介した際に
驚いていただけることが一番多い機能です。
分析対象のテキストデータの特徴が一目で分かるので、
「社内で分析結果を説明する際に重宝しています」とのお声も多く頂きます。
ぜひご活用くださいませ!
また、冒頭にて古賀からご紹介しましたように、次期リリースでは
アドオンに新規機能を追加する予定でございます。
次回のメルマガをご期待ください!
-----------------------------------------------------------------
各種セミナ、ユーザー様事例のご紹介
-----------------------------------------------------------------
◆毎月開催!無料セミナー
https://www.msi.co.jp/event/
◆その他セミナー
https://www.msi.co.jp/tmstudio/seminar
◆TMSユーザー様インタビュー事例
https://www.msi.co.jp/tmstudio/business.html
-----------------------------------------------------------------
メールマガジン バックナンバー
-----------------------------------------------------------------
過去のメールマガジンはこちらをご参照ください。
https://www.msi.co.jp/tmstudio/mailmagazine/index.html
( ユーザ名 : tms , パスワード : msi )
ご質問等がございましたら御気軽にご相談ください。
ご連絡先Eメール:tmstudio-info@msi.co.jp
<お問合せ>
ご不明な点がございましたらいつでもお気軽にご連絡頂ければ幸いでございます。
vmstudio-info@ml.msi.co.jp
Tel:03-3358-6681
(TMS営業担当 岩田 真治)