---
title: データの準備と読み込み
description: MIDAS が対応するファイル形式（CSV、TSV、MDS、ZIP）、自動判定されるデータ型（整数、小数、日付など）、測定尺度（名義・順序・間隔・比率）について説明します。
---

# データの準備と読み込み {#data-preparation-and-import}

## ファイルを読み込む {#loading-a-file}

ランチャー画面の **Open File** ボタンをクリックしてファイルを選択するか、ファイルをランチャー画面にドラッグ&ドロップします。**Open from URL** ボタンでは、CSV、TSV、MDS ファイルの URL を指定して読み込めます。サンプルデータを使う場合は、ランチャー画面の「Sample Data」セクションから選択します。詳しい手順は [基本的な使い方](getting-started) をご覧ください。

プロジェクトを開いた後は、**Data > Import Data...** メニューから追加のデータセットを読み込めます。Import Data ダイアログでは、ローカルの CSV または TSV ファイルを選択するほか、**URL** タブで CSV または TSV の URL を指定して取得できます。URL から取得する場合、配信元のサーバーが CORS（クロスオリジンリソース共有）を許可している必要があります。

## 対応しているファイル形式 {#supported-file-formats}

MIDAS は CSV、TSV、MDS、ZIP の4種類のファイル形式に対応しています。

**CSV（カンマ区切り）**
最も一般的なデータ形式です。カンマ（`,`）で列が区切られています。ファイルの拡張子は通常 `.csv` です。

**TSV（タブ区切り）**
タブ文字で列が区切られたファイルです。ファイルの拡張子は `.tsv` または `.txt` です。

**MDS（MIDAS プロジェクトファイル）**
MIDAS で作成したプロジェクトの保存ファイルです。データセット、グラフ、レポートの状態を保存・復元できます。詳しくは[プロジェクトファイル（MDS）](mds-file-format)を参照してください。

**ZIP（複数 CSV/TSV ファイル）**
複数の CSV または TSV ファイルを含む ZIP アーカイブです。各ファイルが個別のデータセットとしてインポートされます。

Excel 形式（.xlsx）は直接読み込めません。Excel の「名前を付けて保存」から CSV 形式で保存してください。

**文字コード**
UTF-8、Shift-JIS、EUC-JP エンコーディングに対応しています。エンコーディングは自動検出されます。Excel で CSV を保存する場合は、「CSV UTF-8（コンマ区切り）」形式を推奨します。

## ファイルの構造 {#file-structure}

MIDAS は1行目をヘッダー行として扱います。1行目の値が列名になり、2行目以降がデータになります。ヘッダー行がない CSV を読み込む場合は、Import Data ダイアログのプレビュー画面で「First row is header」チェックボックスをオフにしてください。Column1, Column2, ... という列名が自動生成され、1行目もデータとして扱われます。

ヘッダー行が空、または全セルが空白のみの場合、MIDAS はデータを気づかないうちに欠損させないよう、エラーとしてインポートを拒否します。テキストエディタでファイルを修正してから再度インポートしてください。

ヘッダーと列数が食い違う行が含まれる場合の扱いは、読み込み経路によって異なります。Import Data ダイアログからのインポートでは該当行が一覧表示され、ダイアログ内で各行の CSV テキストを編集するか、チェックボックスで除外してからインポートを続行できます。ランチャー画面から読み込んだ場合はエラーになります。テキストエディタでファイルを修正するか、Import Data ダイアログから読み込み直してください。

例：

```csv
Name,Age,Country
Alice,25,USA
Bob,30,Japan
Charlie,28,UK
```

**欠損値の扱い**
CSV の空セルは欠損値（null）として読み込まれます。`NA`、`.`、`-` などの文字列は欠損値として扱われず、そのまま文字列として読み込まれます。詳細は [データ型と測定尺度](concepts-data-types#data-types) を参照してください。統計量の計算やグラフの描画では、欠損値は計算から除外されます。データセットの行自体は削除されません。

## データ型 {#data-types}

MIDAS は読み込んだデータの型を自動的に判定します。対応するデータ型は boolean, int64, float64, date, datetime, string, enum です。各データ型の詳細は [データ型と測定尺度](concepts-data-types) を参照してください。

データ型は列ヘッダーの下に `int64` のように表示されます。データ型が正しく判定されなかった場合は、[列の型変換](column-type-conversion)で修正できます。元のデータセットは変更されず、変換結果は新しいデータセットとして作成されます。

## 測定尺度 {#measurement-scales}

MIDAS は各列に測定尺度（Nominal, Ordinal, Interval, Ratio）を自動的に割り当てます。測定尺度はグラフの種類や使用できる統計手法に影響します。Data Table で列を右クリックし、**Edit Scale of Measurement** から変更できます。

各尺度の意味と分析への影響については [データ型と測定尺度](concepts-data-types) を参照してください。

## Next steps {#next-steps}

- **[Data Table](data-table)** - 読み込んだデータの表示、フィルタ、ソート
- **[グラフの作成](graph-basics)** - データを可視化する

## See also {#see-also}

- **[データ型と測定尺度](concepts-data-types)** - 測定尺度の統計的な意味
- **[高度なグラフ作成](custom-graph)** - Grammar of Graphics による柔軟な可視化
- **[サンプルデータセット](sample-datasets)** - 練習用データ
