トップ > アドオン > NEExtractor

属性のないデータから属性を作成

Text Mining Studio のアドオン、「NEExtractor(エヌイーエクストラクター)」をご紹介いたします。

NEExtractorとは

NEExtractor の「NE」とは「固有表現」(Named Entity)と「数値表現」(Numerical Expression)のダブルミーニングです。NEExtractor はこの二つ、固有表現(組織名、人名、地名、商品名、等)や、数値表現(年齢、値段、等)を抽出し、属性化させる機能です。
例えば、「一番好きなビールは?」というWebアンケートに対して、次のような回答があったとします。
このデータは属性を持っていません。ただ、上記のようなコメントの中には、「年齢」「性別」「ビール名」といった、「属性にしたい情報」があふれています。また、より深い分析をするには、「ビール名」だけではなく、そのビールを販売している企業名、ビールの正式名称なども同時に抽出したいところです。
「性別」を属性化するのであれば、TMStudio 本体でも比較的簡単にできるでしょう。しかし、「年齢」「ビール名」、さらには、「ビール名」からわかる「企業名」「正式名称」まで抽出しようとすれば、大変な手間が必要になります。
NEExtractor を使えばこれらを簡単な操作で抽出できます。

抽出できる固有表現

NEExtractor で抽出できる固有表現は、以下の通りです。
これは、固有表現抽出 で用いている学習データ内容によるものです。ご希望の分野・内容に対して 固有表現抽出 を行いたい場合、それらに基づいた学習データを準備する必要があります。
詳しくは右上のお問い合わせボタンより、お問い合わせください。

特許表示

NEExtractor は、独立行政法人情報通信研究機構が有する以下の特許技術を利用しています。

価格

右上のお問い合わせボタンより、お問い合わせください。