トランザクションデータとマスタデータを結合したい

キーを指定して2つのデータをマージする方法を解説します。マスタデータの例として「商品マスタ」を、トランザクションデータの例として「購買履歴」を扱います。

説明

データによっては、頻繁に更新されない一部のデータを「マスタデータ」という形で、別のテーブルデータとして保存する場合があります。

例えば、ID-POSデータなどを考えても、顧客の属性や商品の属性は、それぞれ「顧客マスタ」「商品マスタ」のデータとして保存されていて、トランザクションデータには「顧客ID」「商品ID」のみが記録される、というような場合です。

例として、商品に関するマスタデータで、商品コードに価格やカテゴリ、発売月といった属性が紐付けられているとします。

マスタデータ

一方、購買履歴を表すトランザクションデータには、顧客が購入した商品が商品コードで記録されているとします。

トランザクションデータ

このとき、MSIPではマージアイコンを用いてトランザクションデータとマスタデータを共通の「商品コード」を用いて結合することができます。

マージ後

使い方

フロー

  1. マージアイコンに、結合したい2つのデータを入力します。
  2. パラメータ設定画面で「マージモード」を「内部結合」にします。
  3. 「左テーブルマージキー列」「右テーブルマージキー列」にマージのキーとなる列(ここでは「商品コード」)を指定します。

設定画面

  1. 実行すると、マージキー列でデータが結合されたテーブルが出力されます。

分析への応用

分析用のデータは、実際には一つのファイルやデータベースで閉じていることは少なく、複数のマスタデータを参照する形で保存されていることがあります。
その場合に、マージアイコンを利用すれば、分析に必要なデータを必要な時に結合することができます。

一般に、マスタデータを結合してしまうと列数が増加し、データの前処理に時間がかかります。
また、マスタデータには分析に不要な情報が含まれていることもあります。

結合前のデータに対して前処理をおこない、また、マスタデータのうち分析に不要なデータを除外した上で、データ分析のアイコンを実行すると、効率的にデータ分析をおこなえます。

OnePoint

マージには、以下の4つのマージモードが用意されています。

マージモード 内容
内部結合 キー列の値が等しい行の組み合わせを出力します。
左外部結合 内部結合の出力結果に加え、左テーブルにしかないキーの行も出力します。左テーブルにしかないキーの行の右テーブルの列の値は欠損です。
右外部結合 内部結合の出力結果に加え、右テーブルにしかないキーの行も出力します。右テーブルにしかないキーの行の左テーブルの列の値は欠損です。
完全外部結合 内部結合の出力結果に加え、一方のテーブルにしかないキーの行も出力します。一方のテーブルにしかないキーの行の他方のテーブルの列の値は欠損です。

詳細はMSIPマニュアルをご参照ください。

関連項目

  • MSIPマニュアル
    • 3.8.16. マージ