フラグとしての整数値を持つ列を整数型ではなくカテゴリ型として扱いたい場合があります。この記事では、自動認識で整数型として読み込まれてしまった列をカテゴリ型に変換する方法を説明します。
説明
整数型になっている列を、カテゴリ型の列に変換したい場合があります。
例えば、MSIPにデータを読み込む際に、0と1からなるフラグ列が整数であると自動認識され、整数型の列になることがあります。
ですが、本来は「0であるか1であるか」のフラグ列なので、学習モデルを作成する際にはカテゴリ型として扱われる方が良い場合があります。
このとき、MSIPの列属性変更アイコンを使うことで、整数型の列をカテゴリ型の列に変換することができます。
使い方
- テーブルデータに列属性変更アイコンを接続します。
- パラメータ設定画面を開き、列型を変更したい列にチェックを入れます。
- 「新列型」で
category
を選択します。
- 実行すると、列型が変更されたテーブルデータが出力されます。
分析への応用
「0であるか1であるか」を分類したい場合、分類モデルの目的変数はカテゴリ型でなければなりません。
分類用の0と1のフラグが整数型で読み込まれてしまった場合には、列属性変更アイコンでカテゴリ型に変換することで、分類モデルの目的変数にすることができます。
例1:データが0に属すか1に属すかを分類する場合
フラグ列として、0と1の値が振られている学習データがあるとします。
例えば、ロジスティック回帰アイコンを使用して、新しいデータが0に分類されるか1に分類されるかを予測するモデルを作成することができます。
このロジスティック回帰のように分類分析をおこなう場合、目的変数である「フラグ列」はカテゴリ型でなければなりません。
例2:正常なデータか異常なデータかを判別する場合
フラグ列として、正常な状態のデータには0、異常な状態のデータには1が付与されている学習データがあるとします。
異常検知フォレストアイコンを使用することで、新しいデータが正常であるか異常であるかを判別するモデルを作成できます。
パラメータ設定画面の「異常フラグ列」に、この0と1のフラグ列を指定することで、
データが正常か異常かを分類するモデルを作成することができます。
ただし、「異常フラグ列」は、正常か異常かを示すカテゴリ型の値でないといけないため、整数型を指定することはできません。
そこで、「異常フラグ列」に指定する列を整数型からカテゴリ型に変換することにより、「異常フラグ列」として扱うことができるようになります。
このように、異常検知フォレストアイコンを使用する際に、整数型からカテゴリ型への変換が必要になる場合があります。
OnePoint
整数型をカテゴリ型に変換する他にも、列属性変更アイコンでは列名を変更することもできます。
分析によって勝手についてしまった列名を変更したい場合などは、列属性変更アイコンをご利用ください。
関連項目
- Alkano マニュアル
- 3.2.8. ロジスティック回帰
- 3.3.4. 異常検知フォレスト