Enum 定義

Enum 型は、有効な値があらかじめ決まっているカテゴリデータを扱うためのデータ型です。値の集合とその順序を定義します。

CSV 読み込みでは Enum 型は自動推論されません。Enum 定義を作成し、string 型の列を Enum 型に変換して使います。Enum 定義はプロジェクト全体で共有され、複数のデータセットの列から参照できます。1つの Enum 定義には最大50個の値を設定できます。50個を超えるカテゴリがある場合は string 型のまま使用してください。

Manage Enums タブを開く

メニューバーから Data > Manage Enums... を選択すると、Enum Definitions タブが開きます。このタブで Enum 定義の作成、編集、削除を行います。

Manage Enums タブ

Enum を手動で作成する

新規作成

  1. + New Enum をクリック
  2. Enum 名を入力
  3. 値を入力する。値は入力した順番で番号が振られ、この番号順がそのまま Enum の値順序になる
  4. + Add Value で値を追加
  5. Save をクリック

バリデーション

  • Enum 名は必須。既存の Enum 名と重複できない
  • 値は1つ以上必要
  • 値の重複は不可

列から Enum を作成する

既存の string 列のユニーク値から Enum 定義を自動生成できます。

  1. Create from Column をクリック
  2. データセットを選択
  3. 列を選択する。string 型の列のみ選択可能
  4. Enum 名を入力する。デフォルトは {列名}_enum
  5. プレビューでユニーク値の一覧、件数、割合を確認
  6. Create Enum をクリック

値は出現頻度の降順にソートされます。ユニーク値が50を超える場合、出現頻度の高い上位50件のみが使用されます。プレビューに警告が表示されるので、対象の値を確認してください。

出現頻度順が目的に合わない場合は、作成後に Edit で値の順序を変更できます。

Create from Column ダイアログ

Enum を編集・削除する

編集

Enum カードの Edit をクリックすると編集モードになります。名前の変更、値の追加・削除・並び替えが可能です。

Enum 型に変換済みの列がある場合、依存関係のチェックが行われます。

  • 名前の変更: 依存する列がある場合は変更できない
  • 値の削除: 依存する列がある場合は警告ダイアログが表示される。削除した値を含むデータは無効になるため、確認後に変更を適用する
  • 順序変更: 依存する列がある場合は警告ダイアログが表示される。順序尺度の列のソート結果に影響するため、確認後に変更を適用する
  • 値の追加: 依存する列がある場合でも制限なく追加できる

削除

Enum カードの Delete をクリックすると、Enum 定義を削除できます。依存する列がある場合は削除できません。先に依存する列のデータ型を変更してください。

string 列を Enum 型に変換する

Enum 定義を作成した後、列の型変換で string 列を Enum 型に変換します。

  1. Data Table で列ヘッダーを右クリックし、Convert Column Types... を選択
  2. 変換したい列の To ドロップダウンで、作成した Enum 名を選択
  3. Preview で変換結果を確認
  4. Apply で変換を実行

変換結果は新しいデータセットとして作成されます。元のデータセットは変更されません。

順序尺度とグラフへの影響

順序尺度への変更

Enum 型の列はデフォルトで名義尺度に設定されます。値の順序に意味がある場合は、Data Table で列ヘッダーを右クリックし、Edit Scale から順序尺度に変更してください。測定尺度は使用できる分析手法にも影響します。詳しくはデータ型と測定尺度を参照してください。

グラフの軸順序

Enum 型の列をグラフの軸に使用すると、測定尺度にかかわらず Enum 定義の値順序に従って軸が表示されます。string 型のカテゴリ列はアルファベット順にソートされるため、特定の順序で表示したい場合は Enum 型への変換が有効です。

See also