Skill Factory — 技能 工厂
v1.0.0技能工厂,AI作为规划层循环迭代生产新技能(需求对齐→选档→设计→生成→测试→对比→迭代→交付),支持手动/半自动/全自动三档模式
运行时依赖
安装命令
点击复制本土化适配说明
Skill Factory — 技能 工厂 安装说明: 安装命令:["openclaw skills install wx-skill-factory"] 该技能用于微信相关操作,可能需要相应的平台账号或API密钥
技能文档
技能 工厂(技能 工厂)
AI 作为规划层和验收层,通过迭代循环生产新的 技能。支持可插拔的外部 AI 作为执行层,也可以由 AI 自身完成全部流程。
触发词
用户说以下任一内容时启动本 技能:
"帮我做一个新 技能" / "创建 技能" "技能 工厂" / "造个 技能" "帮我迭代这个 技能" / "改进 技能" "把这个步骤拆成独立 技能" 使用方式 直接说"帮我做一个 XX 技能",我会从需求对齐开始引导你 说"帮我迭代已有的 XX 技能",我会在已有基础上改进 说"把 XX 技能 的 YY 步骤拆成独立 技能",我会执行子 技能 分裂流程 一、概述
技能 工厂 是一个 meta-技能——造 技能 的 技能。
核心能力:
接收用户需求,设计并生成一个完整的 技能 执行层可插拔:根据任务性质选择不同 AI(如 GPT、Gemini、Claude 等) 三档迭代测试:手动/半自动/全自动 对标驱动:全自动档通过对比参考成品来判断质量 先整后分:初版保持单体,稳定后再按需拆出子 技能
角色分工:
AI(规划层):规划、设计、验收、迭代决策 外部 AI(执行层):内容生成、草稿撰写、代码编写等执行性工作 用户:需求输入、档位选择、最终验收 二、前置条件 如需调用外部 AI,需配置至少一个可用的 AI API(参见 tech-库.md 模板) 如需智能选择执行层 AI,需配置场景-AI 对照表(参见 call-图形界面de.md 模板) 最小可用配置:即使没有外部 AI API,AI 自身也可以作为唯一执行层完成全部流程 三、执行流程 第零步:请求分流
在进入正式流程前,先判断请求类型:
"我要一个新的 XX 技能" → 创建模式:走完整第一步到第九步 "帮我改进/迭代已有的 XX 技能" → 迭代模式:跳到第二步(选档),第三步加载已有 技能 为基础 "帮我把 XX 技能 的 YY 步骤拆成独立 技能" → 分裂模式:走子 技能 分裂流程(见第七章) 不是 技能 相关的请求 → 告知用户此 技能 专用于创建/迭代 技能
迭代模式特殊规则:
已有 技能 自动成为"骨架参考"(跳过第三步的选择环节) 用户可以同时提供对标成品用于全自动档对比 修改基于已有内容,不生成全新文件 第一步:需求对齐 用户提出需求:"我要一个 XX 技能" AI 与用户反复讨论,直到完全理解: 技能 要解决什么问题:核心使用场景 触发方式:什么时候调用这个 技能 输入和输出:用户给什么、技能 产出什么 质量标准:什么样的输出算"好" 参考对标:有没有现成的成品可以作为目标 AI 复述需求给用户确认 用户确认后才进入下一步 禁止跳过此步:需求不清就开始设计 = 浪费迭代次数 第二步:选档
向用户确认迭代模式:
档位 人机比例 适用场景 手动档 用户100% 用户只需要初版,自己改 半自动档 用户在关键节点介入 需要用户判断质量方向 全自动档 用户提供参考,AI 自动迭代 有明确对标成品
全自动档额外参数:
循环上限:用户设定最大迭代次数(建议 3-8 次) 对标材料:用户提供参考成品 第三步:选参考 模板参考:列出所有现有 技能,让用户选择一个结构最接近的作为骨架参考 如果没有合适的,使用通用 技能 骨架(见附录 A) 对标成品(全自动档必须提供): 一个或多个期望输出的样本 AI 分析成品的结构、风格、深度 提取评价维度,用于后续对比 第四步:分析设计 拆解步骤:将 技能 的工作流拆成具体步骤 选择 AI:根据场景-AI 对照表,为每个步骤选择最合适的 AI 粗判子 技能 潜力:标记可能独立的步骤为 [潜在子技能],但不拆分 生成设计文档:展示给用户确认
设计文档格式:
技能 设计:<技能名称>
步骤拆解
- <步骤名> → 执行AI: → [潜在子技能](如适用)
- <步骤名> → 执行AI:
输出格式
<预期的 技能 结构大纲>参考来源
- 骨架参考:<已有技能名称>
- 对标成品:<成品描述>
第五步:生成初版 技能 根据设计文档,生成完整的 技能 内容 包含标准前置元数据(name + description) 包含完整的工作流程、模板、规则 对需要调用外部 AI 的步骤,写入具体的调用指引
生成规则:
参考骨架 技能 的结构和风格 每个步骤必须可独立执行,有明确的输入输出 包含"与其他 技能 的配合"部分
手动档:生成后直接交付用户,流程结束(跳到第九步)。
第六步:测试运行
用真实输入运行刚生成的 技能,验证是否可用。
测试方式:
模拟调用这个 技能 的完整流程 对需要外部 AI 的步骤,实际调用 API 获取输出 记录每个步骤的输入、输出、耗时 记录异常和失败点
测试输出:
测试报告 - 第N轮
执行摘要
- 测试输入:<描述>
- 总步骤数:X
- 成功步骤:Y
- 失败步骤:Z
逐步结果
| 步骤 | 状态 | 执行AI | 输出摘要 | 问题 |
|---|---|---|---|---|
最终输出
<技能 产出的完整结果>第七步:对比反馈(质量门)
将测试输出与参考成品进行对比,产出明确的质量判定。
评分维度(每项 0-10 分):
维度 说明 结构完整度 是否包含所有必要部分 内容深度 内容是否足够详细和专业 风格匹配度 语气、表达方式是否与参考一致 可执行性 步骤是否清晰到可以直接执行 输出质量 最终产出是否达到参考水准
质量判定(质量 Gate):
PASS(总分 >= 40/50)→ 质量达标,直接进入交付 CONCERNS(总分 35-39/50)→ 半自动档展示报告由用户决定;全自动档自动继续迭代 FAIL(总分 < 35/50)→ 进入迭代修改 收敛(连续两轮总分变化 <= 1)→ 质量已稳定,退出迭代
对比报告格式:
对比报告 - 第N轮
质量判定:PASS / CONCERNS / FAIL
评分
| 维度 | 分数 | 上轮 | 变化 |
|---|---|---|---|
| 结构完整度 | X/10 | Y/10 | +Z |
| 内容深度 | X/10 | Y/10 | +Z |
| 风格匹配度 | X/10 | Y/10 | +Z |
| 可执行性 | X/10 | Y/10 | +Z |
| 输出质量 | X/10 | Y/10 | +Z |
| 总分 | XX/50 | YY/50 | +ZZ |
差距分析
- <具体问题>
修改建议(仅 CONCERNS/FAIL 时生成)
- <具体修改建议>
第八步:迭代修改
根据对比报告的修改建议,修改 技能 内容。
迭代规则:
逐条执行修改建议 修改后回到第六步重新测试 循环直到满足退出条件
退出条件(满足任一即退出):
收敛:连续两轮总分变化 <= 1 分 达标:总分 >= 40/50(80%) 到限:达到用户设定的循环上限 用户中断:用户主动喊停(半自动档)
每轮迭代记录:
迭代记录 - 第N轮
- 修改项:<改了什么>
- 测试结果:<通过/失败>
- 总分变化:XX → YY
- 状态:继续迭代 / 收敛退出 / 达标退出 / 到限退出
第九步:交付部署 整理最终版 技能 生成交付报告:
技能 工厂 交付报告
基本信息
- 技能 名称:
- 迭代轮次:N 轮
- 最终评分:XX/50
- 退出原因:收敛 / 达标 / 到限 / 手动
迭代历程
| 轮次 | 总分 | 主要修改 |
|---|---|---|
子 技能 潜力标记
- [潜在子技能] <步骤名>:<独立的理由>
后续建议
- <建议1>
- <建议2>
用户决定部署位置 四、三档模式详细规则 手动档 第一步 → 第二步 → 第三步 → 第四步 → 第五步 → 第九步(直接交付)
跳过测试、对比、迭代 用户拿到初版后自行修改和测试 半自动档 第一步 → 第二步 → 第三步 → 第四步 → 第五步 → 第六步 → 第七步 → [用户确认] → 第八步 → 回到第六步 → ... → 用户满意 → 第九步
每轮迭代后展示对比报告,等用户确认方向 全自动档 第一步 → 第二步 → 第三步 → 第四步 → 第五步 → 第六步 → 第七步 → 第八步 → 回到第六步 → ... → 满足退出条件 → 第九步
用户只在前三步参与,后续完全自动循环 靠收敛/达标/到限三个条件自动退出 五、AI 调用规范 选择执行层 AI
根据场景-AI 对照表(call-图形界面de.md)判断:
该步骤是否需要调用外部 AI 评审验收必须由规划层 AI 自身执行,不可外包 需要外部 AI 时,走三级降级链:主用 AI → 备用 AI → AI 自身 降级规则 规则 说明 失败判定 同一 AI 连续失败 2 次才触发降级 失败类型 HTTP 错误、超时、空响应、解析失败 记录日志 每次降级记录:日期、AI、失败原因、降级到谁 下次重试 降级不是永久的——下一个新任务仍先尝试主用 AI 调用方式
所有第三方 API 统一使用 OpenAI 兼容格式调用。具体的 API 配置参见 tech-库.md,调用模板参见 call-图形界面de.md。
六、对比验收机制 评分维度 维度 权重 评分标准 结构完整度 20% 是否包含所有必要章节和步骤 内容深度 25% 知识密度、专业性、细节程度 风格匹配度 15% 与参考成品的语气、表达一致性 可执行性 25% 步骤能否直接执行、是否有歧义 输出质量 15% 最终产出的整体质量感受 收敛判断 连续两轮总分变化 <= 1 → 收敛退出 总分 >= 40 → 达标退出 当前轮次 >= 循环上限 → 到限退出 否则 → 继续迭代 无参考成品时 跳过"风格匹配度"维度 用 技能 规范(结构完整、步骤可执行、无遗漏)作为评判标准 七、子 技能 分裂规则 设计阶段:粗判标记
标记条件(满足 2 条以上):
该步骤逻辑完整,可独立运行 该步骤在其他 技能 中也可能被复用 该步骤足够复杂,值得单独维护 该步骤使用的 AI 和其他步骤不同 迭代阶段:细调分裂
触发时机:主 技能 基础功能稳定后,用户主动提出。
分裂流程:
从主 技能 中提取目标步骤 用 技能-工厂 自身为该步骤生成独立 技能 在主 技能 中将该步骤替换为子 技能 调用指引 测试主 技能 + 子 技能 的衔接 八、核心规则 需求不清不动手:第一步必须完成,复述确认后才继续 档位即承诺:选了全自动就不中途随意切半自动(除非用户主动要求) 先整后分:初版 技能 保持单体,不提前拆分子 技能 迭代有限:全自动档必须设循环上限,防止空转 降级可用:任何外部 AI 不可用时,AI 自身顶上 记录透明:每轮迭代的修改、评分、决策全部记录 示例
用户:帮我做一个"会议纪要"技能 小龙虾:好的,我来帮你创建一个会议纪要 技能。先确认几个问题:
这个 技能