📦 Data Cleaning Claw数据自动化清洗虾。处理脏数据、重复数据与广告噪音,输出高质量干净数据。 — Data Cleaning Claw 数据自动化清洗虾。处理脏数据、重复数据与广告噪音,输出高质量干净数据。

v1.0.0

触发场景:用户提到“清洗数据”“去重”“数据清理”“脏数据”“数据标准化”“格式统一”“去噪”“数据预处理”“数据质量”“缺失值处理”,或上传 CSV/Excel/JSON 文件并要求清洗处理时。支持:Excel/CSV...

0· 1·0 当前·0 累计
by @tujinsama (Ricky)
下载技能包
最后更新
2026/4/21
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的代码、说明和需求在本地数据清理工具中保持一致,且未发现意外的网络访问或与功能无关的凭据请求。
评估建议
该技能如描述所言:通过打包的 Python 脚本在本地清洗数据。使用前请:(1) 备份原始数据;(2) 避免上传高度敏感或受监管的 PII(完整身份证号、原始银行卡号、健康记录),除非你检查并信任运行环境;(3) 在受控环境中运行脚本,手动安装所列 Python 包,而非自动装到共享系统解释器;(4) 将输出路径设在工作区内,防止意外覆盖系统文件;(5) 如有顾虑,自行审阅附带的脚本(脚本很短,仅执行本地文件 I/O 与转换)。若需代理在敏感文件上自主操作,请考虑额外保护措施或人工审批。...
详细分析 ▾
用途与能力
名称/描述(数据清洗:去重、补全缺失值、标准化、去除 HTML、校验)与附带的脚本(scripts/data_clean.py)及参考文档一致。无需无关二进制文件、环境变量或外部服务。
指令范围
运行时指令要求代理在用户提供的文件上运行所包含的 Python 脚本,并保存输出及一个 .report.json;该脚本读写本地文件,仅执行数据清洗操作。重要隐私提示:该技能设计用于处理个人数据(电话、身份证、邮箱、银行卡)并应用脱敏规则,但仍会读写原始数据及报告文件——用户应避免在未审查的情况下上传高度敏感或受监管数据。指令或代码中未引用任何网络外泄或外部端点。
安装机制
未提供安装规范(仅有说明文档和本地脚本文件)。SKILL.md 和脚本列出了 pip 依赖(pandas、numpy、openpyxl、beautifulsoup4);通过 pip 安装这些依赖是常规做法,但会修改 Python 环境。
凭证需求
该 skill 不请求任何环境变量、凭据或配置路径。代码仅访问运行时(用户提供)的输入/输出文件路径及本地文件系统。不请求凭据的程度与其声明的用途成正比。
持久化与权限
始终为 false,且该 skill 不会请求提升或永久的 agent/system 权限。它不修改其他 skill 或系统级配置。被调用时以本地脚本方式运行。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/21

首次发布

无害

安装命令

点击复制
官方npx clawhub@latest install data-cleaning-claw
镜像加速npx clawhub@latest install data-cleaning-claw --registry https://cn.longxiaskill.com
数据来源ClawHub ↗ · 中文优化:龙虾技能库