データの準備と読み込み
ファイルを読み込む
ランチャー画面の Open File ボタンをクリックし、ファイルを選択します。サンプルデータを使う場合は、ランチャー画面の「Sample Data」セクションから選択します。詳しい手順は基本的な使い方をご覧ください。
対応しているファイル形式
MIDAS は CSV、TSV、MDS、ZIP の4種類のファイル形式に対応しています。
CSV(カンマ区切り)
最も一般的なデータ形式です。カンマ(,)で列が区切られています。ファイルの拡張子は通常 .csv です。
TSV(タブ区切り)
タブ文字で列が区切られたファイルです。ファイルの拡張子は通常 .tsv または .txt です。
MDS(MIDAS プロジェクトファイル) MIDAS で作成したプロジェクトの保存ファイルです。データセット、グラフ、レポートなどの状態を保存・復元できます。
ZIP(複数 CSV ファイル) 複数の CSV ファイルを含む ZIP アーカイブです。各 CSV ファイルが個別のデータセットとしてインポートされます。
Excel 形式(.xlsx)は直接読み込めません。Excel の「名前を付けて保存」から CSV 形式で保存してください。
文字コード UTF-8 エンコーディングに対応しています。Excel で CSV を保存する場合、「CSV UTF-8(コンマ区切り)」形式を選択してください。
ファイルの構造
MIDAS は、データファイルの1行目を列名、2行目以降をデータ行として読み込みます。
- 1行目: 列名(ヘッダー行)
- 2行目以降: データ行
例:
Name,Age,Country
Alice,25,USA
Bob,30,Japan
Charlie,28,UK
データ型と測定尺度
MIDAS は読み込んだデータの型と測定尺度を自動的に判定します。対応するデータ型(boolean, int64, float64, date, datetime, string, enum)と測定尺度の詳細はデータ型と測定尺度を参照してください。
データ型は列ヘッダーに Age (int64) のように表示されます。データ型が正しく判定されなかった場合は、列の型変換で修正できます。元のデータセットは変更されず、変換結果は新しいデータセットとして作成されます。測定尺度は Data Table で列を右クリックし、Edit Scale から変更できます。
Next steps
- Data Table - 読み込んだデータの表示、フィルタ、ソート
- グラフの作成 - データを可視化する
See also
- データ型と測定尺度 - 測定尺度の統計的な意味
- 高度なグラフ作成 - Grammar of Graphics による柔軟な可視化
- サンプルデータセット - 練習用データ