运行时依赖
版本
无用户可见变更,仅版本号提升。
安装命令
点击复制技能文档
# OpenClaw R 统计 ## 何时使用 用户请求任何统计分析、假设检验、组间比较、预测、关联、生存分析、meta 分析、因果推断、功效/样本量计算,或提及 R 统计包时。 ## 此技能不会做的事 - 从观察性数据中宣称因果(使用“与……相关”) - 在没有明确用户意图的情况下进行大规模探索性“钓鱼” - 静默忽略假设违反 - 仅报告 p 值(必须同时给出效应量与置信区间) ## 起飞前检查(强制) 1. 确认数据集存在且可读 2. 运行模式检查:bash {baseDir}/scripts/run-rstats.sh schema --data 3. 报告:行数、列数、类型、缺失值 4. 若缺失 > 5%,警告。若 n < 30,警告样本量小。 ## 环境配置 首次或报错时:bash {baseDir}/scripts/run-rstats.sh doctor 按需安装配置(仅必要时): | 配置 | 脚本 | 方法 | |---------|--------|---------| | 核心 | install-core.R | t 检验、回归、ANOVA、卡方 | | 生存 | install-survival.R | KM、Cox、竞争风险、RMST | | 缺失 | install-missing.R | MICE、MCAR 检验 | | 混合 | install-mixed.R | LMM、GLMM、GEE、ICC | | 贝叶斯 | install-bayes.R | brms、Bayes 因子 | | 因果 | install-causal.R | PSM、IPTW、IV、DiD、RDD、TMLE | | Meta | install-meta.R | meta 分析、NMA | | SEM | install-sem.R | SEM、CFA、lavaan | | 诊断 | install-diagnostic.R | ROC、kappa、alpha | | 高级 | install-advanced.R | GAM、分位数、零膨胀 | | 功效 | install-power.R | 功效/样本量 | ## 工作流 1. 确定分析类型(见 references/METHOD_TABLE.md) 2. 检查数据集模式 3. 构建 JSON 规范: ``json { "dataset_path": "` 4. 保存为 .json,运行:bash {baseDir}/scripts/run-rstats.sh analyze --spec 5. 读取 summary.json + report.md 6. 呈现:摘要 → 统计量 → 解释 → 图形 → 假设 → 注意 ## 分析选择 完整的 82 种方法表及用户意图映射见 references/METHOD_TABLE.md。速查——最常见: | 意图 | analysis_type | |--------|--------------| | 比较 2 组 | ttest 或 wilcoxon | | 比较 3+ 组 | anova 或 kruskal | | 分类关联 | chisq 或 fisher | | 预测连续 | linear_regression | | 预测二分类 | logistic_regression | | 生存曲线 | kaplan_meier | | 生存回归 | cox_regression | | Meta 分析 | meta_analysis | | 因果效应 | propensity_match 或 did | | 功效/样本量 | power_analysis | ## 自动方法切换 - 非正态 + n < 30 → 用 wilcoxon 替代 ttest - 方差不齐 → Welch t 检验(equal_var: false) - 期望格 < 5 → 用 fisher 替代 chisq` - Poisson 过离散 → 建议负二项 - 异方差残差 → 提示稳健标准误 ## 报告规则(不可协商) 每项分析必须包含: - 样本量 (n) 与缺失数据处理 - 方法名称及理由 - 点估计与置信区间 - 效应量(Cohen’s d、η²、R²、OR、HR 等) - 假设检验结果 - 局限性 用语:“与……相关” / “证据表明”——绝不用“证明”/“导致” ## 规范字段参考 每种 analysis_type 的必需/可选字段见 references/SPEC_REFERENCE.md。