基本的な使い方

MIDAS はブラウザで動作する探索的データ分析ツールです。データはブラウザ内で処理され、外部サーバーには送信されません(詳細)。インストール不要ですぐに使い始められます。

チュートリアル:Iris データセットの探索的データ分析

1. サンプルデータを開く

  1. MIDAS を開くと、ランチャー画面が表示されます
  2. "Sample Data" セクションから Iris データセットをクリックします
  3. プロジェクト画面が開きます

MIDAS のランチャー画面で Sample Data セクションから Iris データセットを選択する様子

Iris データセットは、3種類のアヤメ(iris)の花びらと萼片の測定データです(150行×5列)。

2. データを確認する

3つのタブが自動的に開きます:

  • Data Table(左):表形式でデータの内容を表示します
  • Statistics(右上):選択した列の統計情報です
  • Selected Rows(右下):選択した行の詳細です

下のデモで実際に操作してみましょう。列をクリックして選択したり、行をクリックして詳細を確認できます。

実際の画面を見る

クリックしてMIDASアプリケーションを起動

各列の上部には、データ型(float64、string など)と測定尺度(interval、nominal など)が表示されます。列の右端にあるボタンをクリックすると、その列でソートできます。

MIDAS はデータを読み込む際、自動的にデータ型と測定尺度を推論します。推論が正しくない場合は、列を右クリックして変更できます。測定尺度は統計分析やグラフ作成で重要な役割を果たします。詳しくはデータの準備と読み込みをご覧ください。

3. 基本統計量を見る

データの概要を把握するため、基本統計量を確認してみましょう。

  1. Data Table タブで列名をクリックします(例:sepal_length
  2. 右上の Statistics タブにヒストグラムや統計量が自動的に表示されます

Statistics タブに表示された sepal_length 列の統計量:ヒストグラム、Moments、Spread、Quantiles

表示される統計量:

  • Moments(モーメント): mean(平均)、std(標準偏差)、skewness(歪度)、ex. kurt(超過尖度)
  • Spread(ばらつき): iqr(四分位範囲)、range(範囲)
  • Quantiles(分位数): 0%(min)、1%、5%、10%、25%、50%、75%、90%、95%、99%、100%(max)

ヒストグラムから行を選択:

ヒストグラムのビンをクリックすると、その範囲に該当する行が選択されます。右下のSelected Rowsタブに詳細が表示されます。

選択した行のデータを詳しく確認したり、特定の範囲のデータだけを分析したりできます。

Selected Rows タブに表示された選択行の詳細:ヒストグラムで選択した範囲の行データが表形式で表示

ビンをダブルクリックすると、そのビンに属するデータのみを含む Filtered Data タブが新しく開きます。元のデータセットは変更されません。

ダブルクリックによる FilteredData タブの表示

2列を選択して2列間の関係を表示する:

  1. sepal_lengthが選択された状態で、Ctrl/Cmd キーを押しながらsepal_widthをクリックします
  2. Statistics タブに、散布図行列と統計量の比較が表示されます

Statistics タブに表示された2列間の関係:sepal_length と sepal_width の散布図行列と統計量比較

4. グラフを作成する

データを可視化してパターンを探してみましょう。

散布図を作成

  1. 上部のメニューバーから AnalysisGraph Builder... を選択
  2. Graph Type ドロップダウンから Scatter Plot を選択
  3. 各ドロップダウンから以下を選択:
    • X-Axis: sepal_length (interval)(萼片の長さ)
    • Y-Axis: sepal_width (interval)(萼片の幅)
    • Color (Optional): species (nominal)(アヤメの種類)
  4. 散布図が表示され、種類ごとに色分けされます

Graph Builder で作成した散布図:sepal_length×sepal_width の関係を species ごとに色分けして可視化

種類ごとにデータが異なる領域に集まっていることが確認できます。

詳しくはグラフの作成高度なグラフ作成をご覧ください。

5. プロジェクトを保存する

MIDAS では、作業内容を2つの方法で保存できます。

ブラウザに保存する

  1. FileSave to Browser を選択(または Ctrl/Cmd+S)
  2. プロジェクトが自動的にブラウザに保存されます

次回 MIDAS を開くと、ランチャー画面の「Quick Access」セクションに保存したプロジェクトが表示され、すぐに再開できます。ブラウザのデータ消去で失われるため、重要なプロジェクトはファイルとしてもエクスポートしてください。

ファイルとしてエクスポートする

  1. FileExport Project... を選択(または Ctrl/Cmd+Shift+S)
  2. ファイル名を確認・編集(デフォルトはプロジェクト名)
  3. Save をクリック
  4. プロジェクトファイル(.mds 形式)がダウンロードされます

エクスポートした MDS ファイルは他のユーザーと共有できます。ファイルには電子署名が自動付与され、作成者の確認と改竄の検出が可能です。詳しくはプロジェクトファイル(MDS)をご覧ください。

エクスポートしたファイルを開く

  1. MIDAS のランチャー画面で Open File をクリック
  2. 保存した .mds ファイルを選択
  3. プロジェクトが読み込まれ、保存時の状態が復元されます

Next steps

See also