MIDAS ドキュメント
MIDAS はブラウザで動作する探索的データ分析ツールです。探索的データ分析とは、可視化や要約統計量、モデルの当てはめを通じてデータの構造や傾向を把握する分析手法です (Tukey, 1977)。仮説検定も備えており、探索で見出したパターンの確認に使えます。
CSV ファイルを読み込み、統計量の算出、グラフ作成、回帰分析などをブラウザ内で実行できます。データが外部サーバーに送信されることはありません。
はじめに
- 基本的な使い方 - サンプルデータで MIDAS の基本操作を説明します
ユーザーガイド
データの準備
- データの準備と読み込み - CSV/TSV ファイルの読み込み手順
- データセット - CSV から読み込んだデータと、SQL などで生成した派生データの管理
- サンプルデータセット - MIDAS に含まれるサンプルデータの説明
データの探索
- Data Table - データの表示、フィルタ、ソート
画面構成
- ワークスペースとレイアウト管理 - 複数の分析作業を並行管理
データの加工
- 列の型変換 - データ型の変換とエラー処理
- Reshape - Wide↔Long 形式の相互変換
- Dummy Coding - カテゴリ変数のダミー変数への変換
- SQL によるデータ加工 - SQL を使ったデータの変換
データの可視化
- グラフの作成 - ヒストグラム、散布図、棒グラフ、時系列プロット、ペアプロットなどの作成
- 高度なグラフ作成 - Grammar of Graphics に基づき、複数のグラフタイプの重ね合わせやファセット分割ができます
- Custom Graph リファレンス - Geometry/Statistics 一覧
統計分析
- 基本統計量 - 平均、標準偏差、分位数などの統計量の確認
- 仮説検定 - t 検定、Mann-Whitney U 検定、Wilcoxon signed-rank 検定
- クロス集計 - カテゴリ変数の集計とカイ二乗独立性検定
- 線形回帰分析 - Linear Regression タブの使い方
- 一般化線形モデル(GLM) - ロジスティック回帰、ポアソン回帰など、応答変数が正規分布以外の分布に従う場合の回帰分析
- 一般化線形混合モデル(GLMM) - グループ構造を持つデータのランダム切片モデル
- 生存分析 - Kaplan-Meier 法と Cox 回帰
分析結果の整理
- レポート - グラフや統計結果をまとめて保存
プロジェクト管理
- プロジェクト管理 - データセット、レポート、モデルの管理
- Project Overview - リソースの一覧管理
- Project Lineage - 依存関係の可視化
- Compare Projects - プロジェクト間の差分比較
- MDS ファイル - プロジェクトファイルの保存、エクスポート、署名
- 署名鍵の管理 - MDS ファイルの署名検証と信頼済み鍵の管理
チュートリアル
サンプルデータを使い、分析の流れを一通り説明します。
- 心不全データの Kaplan-Meier 生存曲線 - 生存曲線の推定と群間比較
- 用量反応データの Grouped Binomial GLM - 集約二項データのロジスティック回帰
統計の概念
MIDAS で使われている統計手法の背景知識です。必要に応じて参照してください。
- データ型と測定尺度 - 名義・順序・間隔・比率の違いと分析への影響
- OLS の基礎 - 正規方程式、Gauss-Markov の定理、VIF
- GLM の基礎 - 指数型分布族、リンク関数、IRLS
- 仮説検定の考え方 - p 値、効果量、検出力、順位検定、第一種・第二種の過誤
- 生存分析の基礎 - 打ち切り、Kaplan-Meier、Cox 比例ハザードモデル
- GLMM の基礎 - ランダム効果モデル、REML、BLUP、ICC
- 統計用語集 - 推定量、収束概念、尤度、逸脱度などの定義
動作環境
- プライバシーとセキュリティ - データの処理場所、保存方式、外部通信、ブラウザ要件
- PWA・オフライン利用 - アプリとしてのインストールとオフライン利用
サポート
- リリースノート - 新機能・変更履歴
- 質問やバグ報告は contact@midas-app.org までご連絡ください
参考文献
- Tukey, J. W. (1977). Exploratory Data Analysis. Addison-Wesley.