前処理アイコン逆引きガイド
時系列データを学習用データと検証用データに分割したい
需要予測のように、過去の時系列データから未来の時系列データを予測する場合があります。その際、時系列データを特定の日時を境にして学習用と検証用に分割する方法を説明します。
前処理アイコン逆引きガイド
列名を変更したい
テーブルデータの列名を変更する方法を説明します。
前処理アイコン逆引きガイド
入力データを差し替えて分析を実行したい
分析フローを作成後、別のデータで実行をし直したい場合にデータを差し替える方法を説明します。 (ここでは、差し替え前のデータと同じ列構成のデータで差し替えることを想定しています。)
前処理アイコン逆引きガイド
カテゴリデータを任意の順番で並べたい
カテゴリ型の列に順番を定義し、任意の順に並べる方法を解説します。
前処理アイコン逆引きガイド
複数の前処理をまとめたい
複数の処理フローを一つにまとめる「モジュール機能」を紹介します。処理をひとまとめにして、構造や処理の意味を分かりやすくしたいときに利用します。
前処理アイコン逆引きガイド
データをCSV形式で出力したい
MSIPの可視化画面の機能を利用してデータをCSV形式でエクスポートします。分析結果を外部ソフトウェアと連携する場合に利用します。
前処理アイコン逆引きガイド
数値列同士の四則演算をした列を追加したい
列追加アイコンを利用して、数値列同士で四則演算をする方法を解説します。
前処理アイコン逆引きガイド
値が連番になっている列を追加したい
データの1行目から順に1,2,3,4,...と連番が振られる列を作成する方法を解説します。連番の列があると、データの識別や抽出に便利です。
前処理アイコン逆引きガイド
学習用データと検証用データに分割してモデルの評価をしたい
ホールドアウト法と呼ばれる方法で決定木モデルの予測精度を検証するシナリオの作成方法を解説します。
前処理アイコン逆引きガイド
複数の前処理をまとめて他のデータに適用したい
欠損処理や正規化といった前処理をひとまとめにして、他のデータに同様の設定で適用する方法を説明します。「モデリングモジュール機能」を利用します。
前処理アイコン逆引きガイド
値に応じて順位の列を追加したい
カテゴリ変数と数値変数の2つの列があるとき、カテゴリ変数の値ごとに数値変数の値が大きい順に順位を付ける方法を説明します。組ごとに成績順に順位を付ける場合を例に説明します。
前処理アイコン逆引きガイド
基本統計量を表示したい
カテゴリ型の列のヒストグラムの表示、数値型の列の箱ひげ図の表示をする方法を紹介します。可視化画面の「サマリ表示」という機能を用います。
前処理アイコン逆引きガイド
データを一括して出力したい
シナリオ内のデータや作成したグラフを一度に出力します。分析結果のCSVファイルや画像ファイルが複数必要な場合に利用します。
前処理アイコン逆引きガイド
欠損値の処理をしたい
可視化画面でNAなどの値で赤文字で表示される欠損値を処理する方法を説明します。また、欠損処理をしないと動作しないアイコンの一覧を記載しています。
前処理アイコン逆引きガイド
ルールに応じてデータにラベルの列を追加したい
「都道府県」の情報をまとめ上げて「地方」を表すラベルを作成する、といったように何らかのルールに応じてグルーピングを行ってラベルの列を作成する方法を説明します。
前処理アイコン逆引きガイド
条件によって値を変えた列を追加したい
条件によって値が定まる列を作成する方法を解説します。ExcelのIF関数に相当する機能です。
前処理アイコン逆引きガイド
整数型の列をカテゴリ型の列に変換したい
フラグとしての整数値を持つ列を整数型ではなくカテゴリ型として扱いたい場合があります。この記事では、自動認識で整数型として読み込まれてしまった列をカテゴリ型に変換する方法を説明します。
前処理アイコン逆引きガイド
トランザクションデータとマスタデータを結合したい
キーを指定して2つのデータをマージする方法を解説します。マスタデータの例として「商品マスタ」を、トランザクションデータの例として「購買履歴」を扱います。
前処理アイコン逆引きガイド
条件に合うデータだけを抽出し足し合わせたい
特定の条件を満たすデータに対して値を足し合わせる方法を説明します。ExcelのSUMIF関数に相当する機能です。
前処理アイコン逆引きガイド
クロス集計表を作成したい
テーブル内に2列のカテゴリ列があった時に、カテゴリの組み合わせがどれくらいの頻度で出現するかを把握するための頻度表(クロス集計表)を作成します。カテゴリ列間の関連性を把握するときに利用します。
前処理アイコン逆引きガイド
日付から年、月、日、曜日などを取得したい
日時情報アイコンを使用して、日付の値から年月日を取得します。ExcelのYEAR, MONTH, DAY関数に相当する機能です。
前処理アイコン逆引きガイド
列の合計、最小値、最大値を計算したい
数値列の合計、最小値、最大値を求めます。ExcelのSUM、MIN、MAX関数に相当する処理です。
前処理アイコン逆引きガイド
日付を元に月末日を取得したい
日時情報アイコンを使用して、日付の値から月末日を取得します。ExcelのEOMONTH関数に相当する機能です。
前処理アイコン逆引きガイド
日付を条件にしてデータを抽出したい
ある日付以前のレコードのみを抜き出す、もしくは、ある時刻のレコードのみを抜き出すなど、日付を条件にして条件を満たすデータを抽出する方法を説明します。
前処理アイコン逆引きガイド
2つの日付の間の日数を求めたい
2つの日付列の日付の差の日数を計算し、計算結果の列を追加します。ExcelのDAYS関数に相当する機能です。