-------------------------------------------------------------------
Text Mining Studio バージョン6.3 リリース
~ 類義語アドオンの価格改定について ~
~ 類義語アドオン新機能ご紹介 ~
-------------------------------------------------------------------
暖かく過ごせる日も増えてくる時期になってまいりました。
皆様いかがお過ごしでしょうか。
お蔭様で、 2020年3月2日に Text Mining Studio バージョン6.3 を
リリースいたしました。
今回のリリースでは主に類義語アドオンの機能追加を行いました。
https://www.msi.co.jp/tmstudio/newfeatures_6_3.html
また、セミナー等にて以前よりご連絡しておりました通り、
類義語アドオンのみ、2020年4月1日より新価格へ改定させていただきますことを
お知らせ申し上げます。
※なお、同じく2020年4月1日より価格改定を予定しておりました音声テキストアドオンに
つきましては今回価格改定を行いません。今後の価格改定時期は未定です。
■類義語アドオン 価格改定詳細
一般向けのみ、価格を変更いたします。
(アカデミック価格の変更はございません)
・2020年3月20日お申し込み分まで:
スタンドアロン版 1台: 46万円(税抜)
クライアント・サーバ版1ユーザ:80万5千円(税抜)
・2020年4月1日より通常価格:
スタンドアロン版 1台: 92万円(税抜)
クライアント・サーバ版1ユーザ:161万円(税抜)
■お問合せ
大幅に機能アップした類義語アドオンをぜひこの機会にご利用くださいませ。
ご不明な点がございましたら下記宛にお気軽にご連絡ください。
・村木(TMSお見積り担当)
・岩田(TMS営業担当)
TEL : 03 - 3358 - 6681
E-mail: tmstudio-info@ml.msi.co.jp
今後とも TMS ならびに当社製品をどうぞよろしくお願い申し上げます。
(TMS担当 主任研究員 古賀 久芳)
---------------------------------------------------------------------
■【技術コラム】「類義語アドオンって?」な方のための類義語アドオン新機能紹介
---------------------------------------------------------------------
皆さま、こんにちは。
今年度よりTMSチームに加わりました、中西と申します。どうぞよろしくお願い
申し上げます。
先日、Text Mining Studio 6.3 をリリースいたしました。
これに伴い、TMS のアドオンのひとつである「類義語アドオン」にも様々な
機能改善や新機能の追加を行いました。
そこで、今回のメールマガジンでは、
・そもそも類義語アドオンとは?
・今回追加された機能は?
について、簡単にご説明いたします。
◆そもそも類義語アドオンとは?
テキスト分析の精度を高めるために避けて通れないのが「単語のまとめ上げ」
です。
登場回数の多い対象に注目しようと思っても、その対象がいろいろなことばで
書かれていると票が割れてしまい、注目度合いが下がってしまいます。
結果として、分析の方向性を大きく見誤ってしまうことにもなりかねません。
TMS では、似た意味の単語をひとつにまとめ上げる「類義語辞書」や、種々の
単語をカテゴリごとにまとめ上げる「グルーピング」といった機能が用意
されています。
しかしながら、これらの整備が時間と試行錯誤を要する作業であることも
事実です。
類義語アドオンは、このように重要にして手間のかかる単語のまとめ上げを
アシストするアドオンです。
「使われ方が似ている単語は意味も似ているはずだ」という言語学の考え方に
基づいてコンピュータが計算を行い、指定した単語に意味が近いと思われる
単語のランキングを出力します。
昨年 TMS 6.2 と同時にリリースされて以降、上記のような辞書整備や
グルーピングの場で、多くのお客様にご利用いただいております。
類義語アドオンの機能は、大きく分けて
・類義語の検索
・類義語検索の基となる分散表現の作成
の2つです。
類義語の検索については上で述べました。では「分散表現の作成」とは?
実はこの「分散表現」こそ、コンピュータが単語の意味を掴むための鍵なの
です。
分散表現とは、単語を数値の組(ベクトル)で置き換えて表したものです。
そして、使われ方が似ている単語ほど近いベクトルで表される仕組みに
なっています。
つまり、コンピュータがそれぞれの単語間のベクトルの距離を計算すれば、
単語の意味の近さを計算したことになるわけですね。
類義語アドオンは、TMS の分かち書きデータを元に、この分散表現を作成する
機能を備えています。
したがって、お手持ちの文書データから分散表現を作成いただくことで、その
データの文脈に沿った類義語の検索が可能です。
(サンプルデータとして、日英 Wikipedia などの大規模データから作成した
分散表現も類義語アドオンに搭載済みです)
類義語アドオンは、自社開発のディープラーニングツール「Deep Learner」を
エンジンとしています。
近年活発に用いられているディープラーニングの成果を手軽にご利用いただける
アドオンですので、一度お手元でお試しいただく価値のあるものと存じます。
◆今回追加された機能は?
そんな類義語アドオンですが、お客様から頂いたご意見・ご要望を踏まえ、
様々な機能の追加・修正を行いました。
<類義語の検索に関する機能>
・類似/非類似の調整機能
・英語の分散表現サンプルを追加
・検索結果の表示を修正
・バッチ処理機能の追加
<分散表現の作成に関する機能>
・エンジンの高速化
・並列処理数の指定機能
・近似手法の選択肢の修正
・分かち書きデータ追加機能
・設定の保存および初期化機能
今回は、この中から特に3点をピックアップしてご紹介いたします。
(1)単語の類似/非類似をお好みで調整
既に述べたように、類義語アドオンでは指定した単語に似ている単語を検索し、
ランキング形式で結果を表示することができます。
しかし、
「私にとってこの単語とこの単語はあまり似ていない…」
「この単語の順位をもっと上げたい!」
と思われることもあるでしょう。
そのような場合、各単語に対してオプションで「類似」「非類似」を指定して
いただき、再度検索を行なうことで、単語全体の類似度が再調整されるように
なりました。
これにより、各ユーザー様の分析目的に更にフィットした類義語を得られることが
期待できます。
(2)英語の分散表現サンプルを追加
サンプルデータとして、日本語 Wikipedia から作成した分散表現データに加え、
新たに英語版 Wikipedia から作成したデータも追加しております。
英語テキストの分析にも手軽にお使いいただけるようになりました。
(3)分散表現作成エンジンの高速化
これまでの類義語アドオンでは、分散表現作成に長い時間を要する点がネック
でした。
今回のバージョンアップではエンジンの刷新を行い、大幅な高速化を実現
しました。
今回は類義語アドオンの概要と新機能についてご紹介させていただきました。
その他、ご利用の上でご不明な点やご要望、メルマガで扱うテーマのリクエスト等
ございましたら、お気軽にサポートまでご連絡くださいませ。
tmstudio-support@ml.msi.co.jp
(TMS 開発担当 中西 陸大)
-----------------------------------------------------------------
☆営業部からのお知らせ☆
-----------------------------------------------------------------
Text Mining Studio営業担当の岩田でございます。
類義語アドオンは業界用語が多い技術文書や特許、言葉のブレが大きいアンケートや
レポートの分析などにおいて、すでに多くのお客様にご利用いただいております。
今回大幅にバージョンアップした類義語アドオン、現在のキャンペーン価格は
2020年3月20日にて終了いたします。
ぜひご利用をご検討くださいませ!
-----------------------------------------------------------------
各種セミナ、ユーザー様事例のご紹介
-----------------------------------------------------------------
◆毎月開催!TMS体験セミナー
https://www.msi.co.jp/tmstudio/seminarRegular.html
◆TMSスキルアップセミナ:5/14(木)
https://www.msi.co.jp/tmstudio/seminarSkillup.html
◆その他セミナー
https://www.msi.co.jp/tmstudio/seminar
◆TMSユーザー様インタビュー事例
https://www.msi.co.jp/tmstudio/business.html
★Text Mining Studioが比較サイト「ITトレンド」で
2017年度に続き、2018年度前期も、1位に選ばれました!
https://it-trend.jp/award/2018-firsthalf/textmining?r=award2018-firsthalf-tab
最新ランキングでも1位継続中!
-----------------------------------------------------------------
メールマガジン バックナンバー
-----------------------------------------------------------------
過去のメールマガジンはこちらをご参照ください。
https://www.msi.co.jp/tmstudio/mailmagazine/index.html
( ユーザ名 : tms , パスワード : msi )
ご質問等がございましたら御気軽にご相談ください。
ご連絡先Eメール:tmstudio-info@msi.co.jp
<お問合せ>
ご不明な点がございましたらいつでもお気軽にご連絡頂ければ幸いでございます。
vmstudio-info@ml.msi.co.jp
Tel:03-3358-6681
(TMS営業担当 岩田 真治)