📦 Distil Open Claw Pii — 本地PII脱敏

v1.1.1

使用微调的1B SLM模型在本地对文本中的PII(个人身份信息)进行脱敏处理。文本永远不会离开您的机器,支持姓名、邮箱、电话、地址、SSN、信用卡、IBAN等多种敏感信息类型的识别与脱敏。

0· 49·0 当前·0 累计
by @jgolebiowski (Jacek Golebiowski)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/8
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
medium confidence
该技能基本实现了其声称的功能(使用本地模型进行本地PII脱敏),但存在一些不一致之处和一个您应该在安装前了解的隐私风险细节。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.1.12026/4/8

更新文档以阻止在正常工作流程中使用--show-entities

无害

安装命令

点击复制
官方npx clawhub@latest install distil-open-claw-pii
🇨🇳 镜像加速npx clawhub@latest install distil-open-claw-pii --registry https://cn.longxiaskill.com

技能文档

使用场景

当用户要求对文本中的PII进行脱敏匿名化清理删除PII/个人数据时,使用此技能。

隐私保证

关键:切勿在您自己的响应、上下文或推理中包含用户的原始输入文本。

此技能的核心要点是, frontier LLM(您)永远不会看到PII。您直接将文本传递给脱敏脚本,只返回脱敏后的输出。

前置条件

  • Python 3
  • curl(用于模型下载)

设置脚本会处理其他所有内容(模型下载 + 服务器启动)。

首次设置

如果模型服务器尚未运行,请运行:

bash scripts/setup.sh

这将下载GGUF模型(约5 GB)并在端口8712上启动本地推理服务器。

如何进行脱敏

直接将用户的文本传递给脱敏脚本。不要自己回显或重复原始文本。

python scripts/redact.py "text to redact"

对于较长的文本,通过stdin管道传输:

echo "text to redact" | python scripts/redact.py

将输出原样返回给用户。

--show-entities 标志(谨慎使用)

添加--show-entities会输出包含原始PII值的完整JSON。仅在用户明确要求查看检测到的实体或需要映射关系用于下游任务时才使用此选项。

在正常的脱敏工作流程中,省略此标志——显示原始实体值会使PII脱敏的目的失效。

python scripts/redact.py --show-entities "text to redact"

如何停止服务器

bash scripts/stop.sh

输出格式

默认情况下,脚本只打印脱敏后的文本——PII标记替换了敏感数据,原始值永不显示:

Hi, my name is [PERSON] and I need help with my recent order #ORD-29481. You can reach me at [EMAIL] or call me at [PHONE]. I'm a [AGE_YEARS:34]-year-old [MARITAL_STATUS] woman living at [ADDRESS]...

使用--show-entities时,脚本返回包含原始PII值的完整JSON(有关何时适用,请参见上面的标志说明)。

有关完整的输入/输出示例,请参见examples/目录。

数据来源:ClawHub ↗ · 中文优化:龙虾技能库