前処理アイコン逆引きガイド
時系列データを学習用データと検証用データに分割したい
需要予測のように、過去の時系列データから未来の時系列データを予測する場合があります。その際、時系列データを特定の日時を境にして学習用と検証用に分割する方法を説明します。
前処理アイコン逆引きガイド
列名を変更したい
テーブルデータの列名を変更する方法を説明します。
前処理アイコン逆引きガイド
カテゴリデータを任意の順番で並べたい
カテゴリ型の列に順番を定義し、任意の順に並べる方法を解説します。
前処理アイコン逆引きガイド
学習用データと検証用データに分割してモデルの評価をしたい
ホールドアウト法と呼ばれる方法で決定木モデルの予測精度を検証するシナリオの作成方法を解説します。
前処理アイコン逆引きガイド
欠損値の処理をしたい
可視化画面でNAなどの値で赤文字で表示される欠損値を処理する方法を説明します。また、欠損処理をしないと動作しないアイコンの一覧を記載しています。
前処理アイコン逆引きガイド
整数型の列をカテゴリ型の列に変換したい
フラグとしての整数値を持つ列を整数型ではなくカテゴリ型として扱いたい場合があります。この記事では、自動認識で整数型として読み込まれてしまった列をカテゴリ型に変換する方法を説明します。
前処理アイコン逆引きガイド
トランザクションデータとマスタデータを結合したい
キーを指定して2つのデータをマージする方法を解説します。マスタデータの例として「商品マスタ」を、トランザクションデータの例として「購買履歴」を扱います。
前処理アイコン逆引きガイド
クロス集計表を作成したい
テーブル内に2列のカテゴリ列があった時に、カテゴリの組み合わせがどれくらいの頻度で出現するかを把握するための頻度表(クロス集計表)を作成します。カテゴリ列間の関連性を把握するときに利用します。
PythonScriptアイコン逆引きガイド
データをずらした列を追加したい
データを指定した行数分ずらして、新しく列を追加する方法を解説します。
PythonScriptアイコン逆引きガイド
ランダムなデータを作成したい
実数型、整数型、カテゴリ型のそれぞれについて、ランダムな値を取る列を作成する方法を解説します。ダミーデータを作成するときなどに利用できます。
PythonScriptアイコン逆引きガイド
指定した行番号を入力テーブルから抽出したい
行番号を指定して、データを抽出します。指定した行を抜き出したり、指定した行数間のデータをすべて抜き出すことが可能です。