-------------------------------------------------------------------
■【トピック】ユーザーコンファレンス2019 のご案内
-------------------------------------------------------------------
NTTデータ数理システムでございます。
日頃はお引き立てを賜りまして、誠にありがとうございます。
日増しに秋の深まりを感じる今日このごろ、いががお過ごしでしょうか。
毎年大好評をいただいております数理システムユーザーコンファレンスの
参加申し込み受付を開始いたしました。
今年は11/22(金)に東京コンファレンスセンター(品川)にて開催いたします。
http://www.msi.co.jp/userconf/2019/index.html
TMS を利用したご講演の内容は、マーケティング、MR日報、論文、特許、アン
ケート調査、お客様の声分析、コールセンター応対品質調査など様々であり、
大変ありがたいかぎりでございます。
情報共有と知識向上の手段として、またユーザー様同士の交流の場として、
ぜひ皆様ふるってご参加ください。
さて、大阪(梅田)での数理システム製品を用いた各分析体験セミナーを
今週開催いたします。
まだお席に余裕があるセミナもございますので、ぜひ皆さまからのお申込みを
お待ちしております。
TMS セミナーは10/10開催です。
◆10月10日(木)13:30 - 16:30
Text Mining Studio 製造セミナー(不具合情報/特許情報)
(詳細は本メール文末に記載しております)
今後とも TMS ならびに当社製品をどうぞよろしくお願い申し上げます。
(TMS担当 主任研究員 古賀 久芳)
-------------------------------------------------------------------
■【技術コラム】音声テキストアドオンによるTMSのためのデータ加工
-------------------------------------------------------------------
みなさま、こんにちは。TMSチームの 花島 です。
2018年6月に TMS のアドオン製品「音声テキストアドオン」がリリースされてから、
1年以上が経ちました。
音声テキストアドオンの主な機能については以下のメルマガ
【技術コラム】音声テキストアドオンをリリースしました!
https://www.msi.co.jp/tmstudio/mailmagazine/backnumberVol29_20180612.html
でご案内しています。
TMS を利用すると様々なテキストを分析することが可能ですが、
基本的には予め奇麗に整形されたデータを分析することを想定しています。
一方、音声テキストアドオンは、音声認識処理後のテキストをより分析しやすい
形式に整形するための前処理ツールです。
そのため、
- 句読点の付与が不十分な場合
- 「もしもし」等の不要な定型句を除外したい場合
などに対応できるデータ加工機能があります。
実は、作業ログや日報などの中には、上記とよく似た以下のような性質のデータ
があります。
1) 箇条書きの記述が多く、句読点がほとんどない。
2) 形式的な短文のデータと、分析対象としたいデータが
明確な区別なく入り混じっている。
今回は音声テキストアドオンについて
「音声テキスト以外に使う、TMSのためのデータ加工」
をテーマに、音声テキスト以外のデータでの利用ケースをご紹介いたします。
1) 箇条書きの記述が多く、句読点がほとんどないデータ
例:1つのセル(行)の中に、以下のように改行による箇条書きがあるデータ
=========
緊急依頼にて現場に直行
AAAの内部ファンから異音
BBBの計器に異常値なし
部品交換で対処完了
=========
通常の文章であれば、セル内で改行されていたからといって文章が切れている
とは限りません。表示上の読みやすさなどのために、文の途中で改行する場合
が多いからです。
そのため、TMSでは基本的に改行を削除するなどの対処を行います。
例の文の改行を削除すると、以下のような人が読んでも分かりにくい文章に
なります。
=========
緊急依頼にて現場に直行AAAの内部ファンから異音BBBの計器に異常値
なし部品交換で対処完了
=========
この文章をTMSで分かち書きすると「直行AAA」「異音BBB」など、意図
しない単語や係り受け関係が抽出されてしまいます。
<音声テキストアドオンを利用すると?>
音声テキストアドオンでは、入力データを取り込む際にセル内改行を
「。(句点)」に置換することができます。
以下のように「。(句点)」で切れることで、よりTMSで分析しやすい文章に
なります。
=========
緊急依頼にて現場に直行。AAAの内部ファンから異音。BBBの計器に異常
値なし。部品交換で対処完了
=========
句点以外にも「.(ピリオド)」や任意の文字列で置換可能ですので、英語の
文章の加工にも利用可能です。
2) 形式的な短文データと、分析対象のテキストが明確な区別なく入り混じって
いるデータ
例:
=========
1行目:定期メンテナンス
=========
2行目:定期のメンテナンスを行った
=========
3行目:定期メンテナンスにて水漏れを発見。
=========
4行目:ケーブルの断線を確認
=========
上記のようなデータから、「定期メンテナンス」の行を除外したい場合の
利用ケースです。
通常、TMSでは「定期メンテナンス」の行を分析対象から除外したい場合、
以下のような設定を行います。
「定期」と「メンテナンス」を含む行を分析対象から除外する
という設定が可能です。
その場合、以下のように、1~3行目が除外されます。定期メンテナンスについて
記述された行を全て除外したい場合は、以下で問題ありません。
=========
×1行目:定期メンテナンス
=========
×2行目:定期のメンテナンスを行った
=========
×3行目:定期メンテナンスにて水漏れを発見。
=========
○4行目:ケーブルの断線を確認
=========
では、3行目の「定期メンテナンスにて水漏れを発見」を「水漏れ」という現象に
ついての記述が含まれているから分析対象に含めたい、という場合はどうで
しょうか。
<音声テキストアドオンを利用すると?>
音声テキストアドオンなら、不要な単語”のみ”で構成される行だけを除外する
ことが可能です。
今回の例で、分析対象から外したいのは「定期メンテナンス」について”のみ”
記述された行です。
このとき、
「定期」「メンテナンス」「行う」を[不要単語]に登録
することで、「水漏れ」を含む 3行目を分析対象に含めつつ、1,2行目を除外
することが可能です。
=========
×1行目:定期メンテナンス
=========
×2行目:定期のメンテナンスを行った
=========
○3行目:定期メンテナンスにて水漏れを発見。
=========
○4行目:ケーブルの断線を確認
=========
以上、今回は音声テキストアドオンの特殊な利用ケースについてご紹介させて
いただきました。
お使いの上でご不明な点や機能改善のご要望、
またメールマガジンで取り扱って欲しい話題などございましたら
サポートまでお気軽にご連絡くださいませ。
サポート:tmstudio-support@ml.msi.co.jp
(TMS開発担当 花島 空)
-----------------------------------------------------------------
☆営業部からのお知らせ☆
-----------------------------------------------------------------
TMSの営業担当として、今月より就任いたしました岩田真治と申します。
引き続き皆様のご支援をしてまいりますので
どうぞよろしくお願い致します。
◆毎月開催!TMS体験セミナー
https://www.msi.co.jp/tmstudio/seminarRegular.html
◆TMSスキルアップセミナ:11/29(金)
https://www.msi.co.jp/tmstudio/seminarSkillup.html
◆その他セミナー
https://www.msi.co.jp/tmstudio/seminar
◆TMSユーザー様インタビュー事例
https://www.msi.co.jp/tmstudio/business.html
◆情報通信総合研究所様との対談内容
(音声認識とテキストマイニングについて)を掲載しました。
https://www.msi.co.jp/tmstudio/userscase_pdf/MSI_report_K1_0408.pdf
★Text Mining Studioが比較サイト「ITトレンド」で
2017年度に続き、2018年度前期も、1位に選ばれました!
https://it-trend.jp/award/2018-firsthalf/textmining?r=award2018-firsthalf-tab
-----------------------------------------------------------------
メールマガジン バックナンバー
-----------------------------------------------------------------
過去のメールマガジンはこちらをご参照ください。
https://www.msi.co.jp/tmstudio/mailmagazine/index.html
( ユーザ名 : tms , パスワード : msi )
ご質問等がございましたら御気軽にご相談ください。
ご連絡先Eメール:tmstudio-info@msi.co.jp
-------------------------------------------------------------------
【大阪開催】来月10/8(火)より連日開催!分析体験セミナー
-------------------------------------------------------------------
大阪(梅田)での数理システム製品を用いた各分析体験セミナーを
今週開催いたします。
まだお席に余裕があるセミナもございますので、ぜひ皆さまからのお申込みを
お待ちしております。
■■□□□分析体験セミナー一覧□□□■■
◆10月8日(火)10:00-12:00
BayoLink体験セミナー(ベイジアンネットワーク構築)
◆10月8日(火)13:30-16:30
統計解析ツール体験セミナー(回帰、多変量解析、クラスター分析)
◆10月9日(水)10:00 - 12:00
Visual Mining Studio IoTデータ分析ワークショップ(センサーデータからの異常判別)
◆10月9日(水)13:30-16:30
Visual Mining Studio体験セミナー(データマイニング)
◆10月10日(木)10:00 - 12:00
Text Mining Studioアカデミックセミナー(医療/看護研究)
(残席わずか)
◆10月10日(木)13:30 - 16:30
Text Mining Studio 製造セミナー(不具合情報/特許情報)
◆10月11日(金)10:00 - 12:00
Numerical Optimizer体験セミナー(最適化)
◆10月11日(金)13:30 - 16:30
S4 Simulation System体験セミナー(シミュレーション)
●場所:AP 大阪駅前 梅田1丁目
大阪市北区梅田1-12-12 東京建物梅田ビル 地下1F
Tel : 06-6343-5109
JR 大阪駅中央南口より徒歩約 2 分
地図:https://www.tc-forum.co.jp/kansai-area/ap-osakaekimae/oe-base/
●料金:無料
●各日程/お申込み方法
お申込みフォーム:https://www.msi.co.jp/event/
●お申し込み・問合せ先
株式会社NTTデータ数理システム 営業部
TEL: 03(3358)6681
email:vmstudio-info@ml.msi.co.jp
満席になった時点でお申込受付を終了させていただきます。
お申込をお待ち申し上げております。
(TMS営業担当 岩田 真治)