📦 Data — 数据
v1.0.0Cleaner 利用 AI 驱动的去重、缺失值填充、格式归一化、多源合并及 Feishu 原生输出,对多格式数据进行清洗与标准化。
0· 12·0 当前·0 累计
安全扫描
OpenClaw
可疑
medium confidence该技能的代码与其声明的清理功能基本相符,但在外部 AI 和 Feishu 集成以及所需凭证/配置方面存在明显不一致——使用前请确认。
评估建议
该技能主要在本地实现了宣传的数据清洗功能,但存在两处缺口需谨慎:
1. AI 功能依赖外部服务商(MiniMax / DeepSeek),若提供 API key 会将数据发往这些服务——在未审计网络请求及服务商隐私政策前,勿对敏感 PII 启用 AI。
2. 承诺支持 Feishu 回写,但 registry 元数据中未声明任何 Feishu 凭据——请检查 scripts/output.py 与 scripts/main.py 中的 Feishu 认证方式,再决定是否启用 Feishu 输出。
请开发者更新 registry,声明所需环境变量(DATA_CLEANER_API_KEY 及所有 Feishu 凭据),并澄清 README 中“处理完全本地”的说法。若无法检查缺失代码(main/output),请在沙箱运行技能、审查网络活动,并在上述不一致解决前避免上传高度敏感数据。...详细分析 ▾
ℹ 用途与能力
代码库实现了宣传的解析、字段识别、清洗、去重、报告和合并功能(存在大量 Python 模块)。然而,SKILL.md / README 宣称支持 Feishu-native 输出和 AI 功能,而注册元数据却未声明任何必需的环境变量或主凭证——这一不匹配需要解释(Feishu 写入和 AI API 通常需要凭证)。
⚠ 指令范围
运行时指令直接执行 scripts/main.py,并说明 AI 模型(MiniMax/DeepSeek)及 Feishu Bitable/Doc 输出的用法。README 声称“所有处理均在本地完成”,但 SKILL.md 与代码引用了外部 AI 提供方及 Feishu 回写。提供的 SKILL.md 还展示了接受 ai_model/ai_api_key 参数的 CLI/Python API 调用;若启用,即暗示会发起网络请求。未看到完整的 main.py/output.py,无法确定数据何时/是否被外发;这种不确定性构成风险。
✓ 安装机制
未提供安装规范(仅含说明/代码包),因此安装时不会自动下载任何内容。项目依赖标准 Python 包(pandas、openpyxl、fuzzywuzzy 等)——安装它们是开发者的常规操作,而非由该 skill 隐藏处理。
⚠ 凭证需求
Registry 元数据未列出任何必需环境变量,但 SKILL.md/README 声明了 DATA_CLEANER_API_KEY(用于 MiniMax/DeepSeek)和 DATA_CLEANER_TIER。该 Skill 还声称输出到 Feishu,却未在元数据中声明 Feishu 凭据(app_id/app_secret/token)——Skill 可能在运行时依赖未声明的额外凭据。这种不一致降低了透明度,若用户输入 API 密钥,可能导致意外对外传输数据。
✓ 持久化与权限
技能标志为默认(always:false,允许代理调用)。README 指出本地状态保存在 /tmp/data_cleaner_state.json——在 /tmp 写入本地状态符合配额预期,且范围合理。无证据表明该技能请求永久“always”启用或修改其他技能的配置。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/4/22
Multi-Source Data Cleanser 初始发布: - 清理并去重来自 Excel、CSV、JSON 及剪贴板文本的杂乱数据。 - AI 自动识别常见字段(姓名、电话、邮箱、地址等),可手动覆盖。 - 智能补全缺失值、格式标准化、模糊匹配(Pro)。 - 多源数据合并与冲突解决(Pro)。 - 导出 Excel/CSV,写入飞书多维表格,生成质量报告(Pro)。 - 分层定价:免费、Basic、Standard、Pro。
● 无害
安装命令
点击复制官方npx clawhub@latest install data-cleaner
镜像加速npx clawhub@latest install data-cleaner --registry https://cn.longxiaskill.com