キーを指定して2つのデータをマージする方法を解説します。マスタデータの例として「商品マスタ」を、トランザクションデータの例として「購買履歴」を扱います。
説明
データによっては、頻繁に更新されない一部のデータを「マスタデータ」という形で、別のテーブルデータとして保存する場合があります。
例えば、ID-POSデータなどを考えても、顧客の属性や商品の属性は、それぞれ「顧客マスタ」「商品マスタ」のデータとして保存されていて、トランザクションデータには「顧客ID」「商品ID」のみが記録される、というような場合です。
例として、商品に関するマスタデータで、商品コードに価格やカテゴリ、発売月といった属性が紐付けられているとします。
一方、購買履歴を表すトランザクションデータには、顧客が購入した商品が商品コードで記録されているとします。
このとき、MSIPではマージアイコンを用いてトランザクションデータとマスタデータを共通の「商品コード」を用いて結合することができます。
使い方
- マージアイコンに、結合したい2つのデータを入力します。
- パラメータ設定画面で「マージモード」を「内部結合」にします。
- 「左テーブルマージキー列」「右テーブルマージキー列」にマージのキーとなる列(ここでは「商品コード」)を指定します。
- 実行すると、マージキー列でデータが結合されたテーブルが出力されます。
分析への応用
分析用のデータは、実際には一つのファイルやデータベースで閉じていることは少なく、複数のマスタデータを参照する形で保存されていることがあります。
その場合に、マージアイコンを利用すれば、分析に必要なデータを必要な時に結合することができます。
一般に、マスタデータを結合してしまうと列数が増加し、データの前処理に時間がかかります。
また、マスタデータには分析に不要な情報が含まれていることもあります。
結合前のデータに対して前処理をおこない、また、マスタデータのうち分析に不要なデータを除外した上で、データ分析のアイコンを実行すると、効率的にデータ分析をおこなえます。
OnePoint
マージには、以下の4つのマージモードが用意されています。
マージモード | 内容 |
---|---|
内部結合 | キー列の値が等しい行の組み合わせを出力します。 |
左外部結合 | 内部結合の出力結果に加え、左テーブルにしかないキーの行も出力します。左テーブルにしかないキーの行の右テーブルの列の値は欠損です。 |
右外部結合 | 内部結合の出力結果に加え、右テーブルにしかないキーの行も出力します。右テーブルにしかないキーの行の左テーブルの列の値は欠損です。 |
完全外部結合 | 内部結合の出力結果に加え、一方のテーブルにしかないキーの行も出力します。一方のテーブルにしかないキーの行の他方のテーブルの列の値は欠損です。 |
詳細はMSIPマニュアルをご参照ください。
関連項目
- MSIPマニュアル
- 3.8.16. マージ