安全扫描
OpenClaw
可疑
medium confidence该技能的指令记录错误并自动生成/强制执行持久规则,符合其既定目的,但赋予了广泛、持久的自我修改行为,边界模糊且与其他技能交互不明——逻辑自洽但潜在风险较高,需更明确的安全保障。
评估建议
该技能与其自我改进目标一致,但会写入并强制执行持久规则,并赋予代理广泛自由以更改行为并调用验证工具。安装前:
1)确认 memory/mistakes.json 与 WORK_RULES.md 的存储位置及可读对象。
2)在技能进行永久规则变更或影响其他技能的规则强制前,必须获得用户明确同意。
3)询问限制:禁止记录的数据类型(PII、机密),并提供自动脱敏。
4)确保具备清晰的恢复/重置/撤销机制(可审查并删除规则,关闭持久化)。
5)优先采用更具体、可审计的验证步骤(精确命令及执行时机),并设定安全的故障开放/故障关闭策略。
6)若计划允许自主调用,先限制直至可审计 WORK_RULES.md 内容并确认未记录敏感数据。
若未添加上述安全措施,视该技能为高风险,可能导致非预期的持久行为。...详细分析 ▾
✓ 用途与能力
名称/描述(自我改进代理)符合说明:SKILL.md 描述记录错误、生成 WORK_RULES.md,并根据规则调整行为。未请求意外的二进制文件、环境变量或安装。
⚠ 指令范围
指令明确读写持久化文件(memory/mistakes.json、WORK_RULES.md),并指示 agent“调整行为”,跨会话强制规则。它们还调用验证命令如“openclaw cron list”,并建议使用“session_status”或 Python,而不限制何时或如何运行外部命令。指导属于高层级,赋予 agent 极大自由裁量权(例如“检查:我是否即将违反任何已学规则?若是→调整行为”),可能导致意外或难以审计的行为。
✓ 安装机制
仅含指令的技能,无安装规范或下载代码 — 安装风险最低。除代理在运行时根据指令可能创建的内容外,安装程序不会向磁盘写入任何内容。
✓ 凭证需求
无需环境变量、凭据或配置路径。该技能的需求(用于持久化规则的本地 JSON/MD 文件)与其声明目的相称。尽管如此,若不受限制,技能将持久化数据,其中可能包含敏感内容。
⚠ 持久化与权限
尽管 always:false,该技能仍指示持久、跨会话的状态(mistakes.json 和 WORK_RULES.md)以及代理行为的自我修改。这种持久、自我强化的规则集可能影响代理与其他技能和用户的交互;SKILL.md 缺乏明确的安全控制(同意、限制、清理、覆盖/回滚),增加了非预期长期行为变更的风险。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/4/20
初始版本:能够从错误中学习且永不重犯的 AI Agent
● 无害
安装命令
点击复制官方npx clawhub@latest install xiaobai-self-improve
镜像加速npx clawhub@latest install xiaobai-self-improve --registry https://cn.longxiaskill.com
技能文档
从错误中学习、持续进化的 AI Agent,不再重复同样错误。
问题
AI Agent 反复犯同样错误:- 忘记验证就宣称“已完成”
- 时间计算出错
- 承诺任务却未执行
- 给出模糊回应而非具体行动
解决方案
错误日志
在memory/mistakes.json 记录每一次错误:
``json
{
"mistakes": [
{
"date": "2026-04-21",
"type": "fake_completion",
"description": "声称“cron 任务已创建”,实则仅写入文件",
"impact": "用户未收到定时消息",
"lesson": "任何创建操作后必须先通过 cron list 验证任务存在",
"rule": "创建动作后必须执行验证命令"
},
{
"date": "2026-04-21",
"type": "time_calculation",
"description": "说“1 分钟后”实为 1 小时",
"impact": "用户预期错误",
"lesson": "绝不心算时间,必须借助工具",
"rule": "使用 session_status 或 date 命令获取时间,禁止心算"
}
]
}
` 改进规则
根据错误在 WORK_RULES.md 自动生成规则:
`markdown
已学规则(来自错误)
创建任何 cron 任务后 → 必须执行openclaw cron list验证时间计算 → 必须使用session_status或 Python,禁止心算- 多步骤任务 → 每步必须 checkpoint
- 工具报错 → 立即报告,禁止静默重试
自检协议
每次心跳或会话启动:
`
- 读取 mistakes.json
- 读取 WORK_RULES.md
- 检查:是否即将违反已学规则?
- 若是 → 调整行为
- 若犯错 → 立即记录
` 错误分类
| 类型 | 描述 | 预防措施 |
|------|------|----------|
| fake_completion | 宣称完成却未执行 | EVR:执行-验证-报告 |
| time_calculation | 时间计算错误 | 用工具,禁心算 |
| silent_failure | 工具失败却未告知 | 立即报告 |
| vague_promise | 空口承诺“我会做” | 先执行再报告 |
| forget_context | 丢失关键信息 | 使用 memory 工具 |
| wrong_assumption | 未核实就猜测 | 先验证再断言 | 使用示例
当你犯错时:
`
用户:“你说 1 分钟,其实是 1 小时”
我确认此错误。记录如下:
- 类型:time_calculation
- 教训:时间计算必须用工具,禁心算
- 新规则已写入 WORK_RULES.md
我不会再犯此错。
` 开始任务时:
`
我要创建 cron 任务。查阅 WORK_RULES.md:
- 规则 #1:创建后 → 必须用 cron list 验证
[创建任务]
[执行 openclaw cron list]
[确认任务存在]
任务已验证 ✅
` 用户纠正你时:
`
用户:“你本该先检查再说完成”
记录错误:
- 类型:fake_completion
- 教训:完成前必须验证
- 此条永久写入 WORK_RULES.md
该错误已存入永久记忆,不会重现。
`` 与其他技能集成
- EVR —— 自我改进强化“执行-验证-报告”
- Memory Guard —— 错误跨会话持久化
- Daily Reflection —— 日终回顾错误
- Error Recovery —— 记录导致错误的异常