グラフの作成

データを可視化するためのグラフを作成できます。ヒストグラム、散布図、棒グラフ、時系列プロットなど基本的なグラフの種類と作成方法を説明します。

グラフの作成方法

  1. Graph Builder タブを開く: メニューバーから AnalysisGraph Builder... を選択します
  2. データセットを選択: ヘッダー部分のドロップダウンから、グラフ化するデータセットを選択します
  3. グラフタイプを選択: 表示したいグラフの種類(Histogram、Scatter Plot、Bar Chart など)をクリックします
  4. 設定を行う: 選択したグラフタイプに応じて、軸や変数を設定します
    • ヒストグラム: 変数、ビン数、グループ化
    • 散布図: X 軸、Y 軸、色分け
    • 棒グラフ: カテゴリ、値、集計方法、並び替え
  5. オプションを調整: 必要に応じて、フィルタ条件や追加のオプションを設定します

グラフは右側のプレビュー領域にリアルタイムで表示されるため、設定を変更しながら最適な可視化を探せます。

基本的なグラフ

ヒストグラム(Histogram)

1つの数値変数の分布を棒グラフで表示します。データの頻度分布や分布の形状(対称性、裾の広がり、ピークの数など)を把握するのに便利です。

使用例:

  • 年齢の分布を確認する
  • 試験の点数の分布を調べる
  • 売上金額の分布を把握する

設定項目:

Basic:

  • Column: グラフ化する数値列を選択します
  • Bins: 棒の数を指定します。デフォルトは10です。分布の形状はビン数によって見え方が変わるため、値を変えて確認することを推奨します
  • Orientation: 縦棒または横棒を選択します
  • Show Density Curve: カーネル密度推定による滑らかな曲線を重ねて表示します。密度曲線は右側の第2軸(Density)で描画されるため、棒グラフの件数軸はそのまま維持されます。ビンの区切りに依存しない分布の形状を確認できます

Grouping:

  • Group By: カテゴリ列を選択すると、グループごとに色分けして表示します。表示方法は Overlay(半透明で重ね合わせ)、Stacked(積み上げ)、Faceted(グループごとに別パネル)から選択できます

Annotations:

  • Show Mean: 平均値を実線で表示します。Group By を設定している場合は、グループごとの平均値がそれぞれ表示されます
  • Show Median: 中央値を破線で表示します。Group By を設定している場合は、グループごとの中央値がそれぞれ表示されます

MIDAS のヒストグラム機能で作成した数値変数の分布グラフ:ビン(棒)ごとにデータの頻度を表示し、分布の形状を視覚化

散布図(Scatter Plot)

2つの数値変数の関係を点で可視化します。変数間の関連パターンやデータ点の密集・散在を視覚的に探索できます。2次元カーネル密度推定による等高線表示やカテゴリ変数によるグループ化にも対応しています。

使用例:

  • 身長と体重の関係を調べる
  • 広告費と売上の関連を確認する
  • 2つの試験科目の得点の関係を見る

設定項目:

Basic:

  • X-Axis: 横軸に使用する数値列を選択します
  • Y-Axis: 縦軸に使用する数値列を選択します
  • Color: カテゴリ列を選択すると、グループごとに色分けします

Density:

  • Display Mode: 表示モードを選択します
    • Points only: 点のみを表示します
    • Density only: 2次元カーネル密度推定による等高線のみを表示します
    • Points + Density (Outliers Only): 等高線に加え、密度が低い領域の点のみを表示します。各データ点について周囲の推定密度値を計算し、その値が全データ点中で下位10%に入る点が表示対象です。これは統計的な外れ値検定ではなく、密度に基づく表示フィルタです
    • Points + Density (All Points): 等高線と全ての点を表示します

Reference Lines:

  • Add Reference Line: 参照線を追加して、特定の値や閾値を表示します

回帰直線や平滑化曲線を散布図に重ねるには Custom Graph を使用します。

MIDAS の散布図(Scatter Plot):X 軸と Y 軸に2つの数値変数を配置し、各データポイントを点で表示。変数間の関連パターンの探索に使用

棒グラフ(Bar Chart)

カテゴリごとの値を縦棒または横棒で比較します。カテゴリデータの比較、ランキング表示、集計統計(カウント、合計、平均など)の表示に最適です。

使用例:

  • 商品カテゴリ別の売上を比較する
  • 地域別の顧客数を表示する
  • 月別の注文件数を集計する

設定項目:

  • Category Column: カテゴリを表す列を選択します
  • Values: 集計する数値列と集計方法を選択します。集計方法は Sum、Average、Min、Max から選べます。数値列の代わりに Count (Frequency) を選ぶと件数を集計します
  • Orientation: 縦棒または横棒を選択します
  • Sort Order: 並び替え順序を選択します。アルファベット順、値の降順、値の昇順があります
  • Top N Categories: 上位 N 件のカテゴリのみを表示します
  • Show value labels: 棒の上に値を表示します

MIDAS の棒グラフ(Bar Chart):カテゴリごとの値を縦棒または横棒で表示し、集計方法(カウント・合計・平均など)を選択可能

時系列プロット(Time Series Plot)

時間経過に伴うデータの変化を折れ線で表示します。トレンドや季節的なパターンを視覚的に探索できます。複数の時系列を異なる線スタイルで表示し、期間ごとの比較も可能です。

使用例:

  • 日次の売上推移を確認する
  • 月次の訪問者数の変化を追跡する
  • 年次の気温変動を観察する

設定項目:

Basic:

  • X-Axis (Time): 日付または日時を表す列を選択します
  • Y-Axis (Values): 表示する数値列を選択します。複数選択できます。複数の列を選択した場合、すべての系列が共通の Y 軸スケールで表示されるため、値の範囲が大きく異なる列を同時に表示すると一方が読み取りにくくなることがあります

Ranges:

  • Custom Range Bands: 特定の期間や範囲を強調表示するバンドを追加します

Advanced:

  • Chart Title: グラフのタイトルを設定します

MIDAS の時系列プロット(Time Series Plot):時間軸に沿ったデータの変化を折れ線で表示し、トレンドや季節性のパターンを可視化

その他のグラフ

ペアプロット(Pair Plot)

複数の数値変数間のペアワイズ関係を散布図の行列で表示します。対角線にはヒストグラム、非対角線には散布図と Pearson の積率相関係数が表示されます。Pearson の相関係数は線形関係の強さと方向を測定するため、非線形な関係がある場合は散布図のパターンも合わせて確認してください。

使用例:

  • 複数の測定値間の相関を一度に確認する
  • データセット全体の構造を把握する

設定項目:

  • Variables: 表示する数値列をチェックボックスで選択します(interval/ratio 尺度の列が対象、最低2変数)。6変数を超えるとパフォーマンスと可読性に影響する旨の警告が表示されます
  • Display Order: 選択した変数の表示順序を変更します

MIDAS のペアプロット(Pair Plot):複数の数値変数間のペアワイズ関係を散布図行列で表示。対角線には各変数の分布を表示し、多変量の相関関係を一度に確認可能

日時ヒストグラム(Datetime Histogram)

日時データの分布を時間軸上のヒストグラムで可視化します。イベントの発生頻度を時間間隔ごとに集計し、時系列パターンを把握できます。

使用例:

  • ログイベントの発生頻度を時間帯別に確認する
  • アクセス数の時間的な集中度を可視化する
  • 注文や取引の時間分布を分析する

設定項目:

  • Date/Time Column: 日時または日付を表す列を選択します
  • Time Interval: 集計する時間間隔を選択します。Auto のほか、1分から1年までの間隔を指定できます
  • Show trend line: LOESS(局所重み付け回帰)によるトレンドラインを表示します。スパンは0.75(全データ点の75%を近傍として使用)に固定されています

MIDAS の日時ヒストグラム(Datetime Histogram):日時データの分布を時間軸上のヒストグラムで表示し、イベントの発生頻度と時系列パターンを可視化

カスタムグラフ(Custom Graph)

Grammar of Graphics の原則に基づいた柔軟な可視化を作成します。幾何学的要素、統計変換、美的マッピングを組み合わせてレイヤー化されたプロットを構築できます。

詳細は Custom Graph ガイド をご覧ください。

グラフの操作

インタラクティブな選択

すべてのグラフでデータポイントの選択が可能です。選択方法はグラフタイプによって異なります:

矩形選択(散布図、ヒストグラム、日時ヒストグラム)

  • Select mode: マウスでドラッグして範囲を選択します
  • Pan mode: グラフをドラッグして表示範囲を移動します

モード切り替えボタンがグラフ内の右下に表示されます。

クリック選択(棒グラフ、時系列プロット、ペアプロット、カスタムグラフ)

  • 棒、点、ビンをクリックして選択します
  • Ctrl/Cmd+クリックで追加選択または選択解除します

選択した行は Data Table、Statistics、Selected Rows など他のタブでもハイライト表示されます。

グラフの保存

Graph Builder で作成したグラフ設定は、タブの状態としてプロジェクトに自動的に保存されます。プロジェクトを閉じて再度開いても、グラフの設定が保持されます。

設定の変更

グラフの設定(列の選択、フィルタ、表示オプションなど)はいつでも変更できます。設定を変更すると、グラフがリアルタイムで更新されます。

Next steps

See also