MIDAS ドキュメント
MIDAS はブラウザで動作する探索的データ分析ツールです。探索的データ分析は Tukey が提唱した分析手法で、可視化や要約統計量、モデルの当てはめを通じてデータの構造や傾向を把握します。
CSV ファイルを読み込み、統計量の算出、グラフ作成、回帰分析などをブラウザ内で実行できます。データが外部サーバーに送信されることはありません。
はじめに
- 基本的な使い方 - サンプルデータで MIDAS の基本操作を説明します
ユーザーガイド
データの準備
- データの準備と読み込み - CSV/TSV ファイルの読み込み手順
- データセット - CSV から読み込んだデータと、SQL などで生成した派生データの管理
- サンプルデータセット - MIDAS に含まれるサンプルデータの説明
データの探索
- Data Table - データの表示、フィルタ、ソート
- 行の選択 - タブ間で連動する行選択の仕組み
画面構成
- ワークスペースとレイアウト管理 - 複数の分析作業を並行管理
データの加工
- 列の型変換 - データ型の変換とエラー処理
- Reshape - Wide↔Long 形式の相互変換
- Dummy Coding - カテゴリ変数のダミー変数への変換
- SQL によるデータ加工 - SQL を使ったデータの変換
- Enum 定義 - カテゴリデータ用の Enum 型の作成と管理
データの可視化
- グラフの作成 - ヒストグラム、散布図、棒グラフ、時系列プロット、ペアプロットなどの作成
- 高度なグラフ作成 - Grammar of Graphics に基づき、複数のグラフタイプの重ね合わせやファセット分割ができます
- Custom Graph リファレンス - Geometry/Statistics 一覧
統計分析
- 基本統計量 - 平均、標準偏差、分位点などの統計量の確認
- 分散分析(ANOVA) - 一元配置・二元配置の分散分析と Tukey HSD 事後検定
- 実験計画法(DoE) - 2水準直交表の生成と分析
- クロス集計 - カテゴリ変数の集計
- 線形回帰分析 - Linear Regression タブの使い方
- 一般化線形モデル(GLM) - ロジスティック回帰、ポアソン回帰など、応答変数が正規分布以外の分布に従う場合の回帰分析
- 一般化線形混合モデル(GLMM) - グループ構造を持つデータのランダム切片モデル
- 生存分析 - Kaplan-Meier 法と Cox 回帰
分析結果の整理
プロジェクト管理
- プロジェクト管理 - データセット、レポート、モデルの管理
- Project Overview - リソースの一覧管理
- Project Lineage - 依存関係の可視化
- Compare Projects - プロジェクト間の差分比較
- MDS ファイル - プロジェクトファイルの保存、エクスポート、署名
- 署名鍵の管理 - MDS ファイルの署名検証と信頼済み鍵の管理
チュートリアル
サンプルデータを使い、分析の流れを一通り説明します。
- 射出成形条件の最適化 - 3因子2水準の実験計画法データの分析
- 心不全データの Kaplan-Meier 生存曲線 - 生存曲線の推定と群間比較
- 用量反応データの Grouped Binomial GLM - 集約二項データのロジスティック回帰
統計の概念
MIDAS で使われている統計手法の背景知識です。必要に応じて参照してください。
- データ型と測定尺度 - 名義・順序・間隔・比率の違いと分析への影響
- OLS の基礎 - 正規方程式、Gauss-Markov の定理、VIF
- GLM の基礎 - 指数型分布族、リンク関数、IRLS
- 生存分析の基礎 - 打ち切り、Kaplan-Meier、Cox 比例ハザードモデル
- GLMM の基礎 - ランダム効果モデル、REML、BLUP、ICC
- 統計用語集 - 推定量、収束概念、尤度、逸脱度などの定義
動作環境
- プライバシーとセキュリティ - データの処理場所、保存方式、外部通信、ブラウザ要件
- PWA・オフライン利用 - アプリとしてのインストールとオフライン利用
サポート
- リリースノート - 新機能・変更履歴
- 質問やバグ報告は contact@midas-app.org までご連絡ください