Sharpagent Self Evolving — Sharpagent 自我演化
v1.0.0SharpAgent 自我进化循环 —— 一个自动的“思考→执行→学习”循环。将自我改进代理的反思机制与自动研究实验...
运行时依赖
安装命令
点击复制技能文档
SharpAgent 自我进化循环 v1.0.0 让您的代理在每个任务中变得更智能。一个任务的结束是下一个进化的起点。融合了 R2 中的两个关键发现:自我改进代理反思 × 自动研究实验验证。
核心哲学 大多数代理完成一个任务后就会停止。下一次出现类似问题时,它会从头开始。没有积累。SharpAgent 的自我进化循环打破了这个循环: ① 执行任务 → ② 反思(“什么可以改进?”)↓ ⑤ 吸收教训 → ③ 形成改进假设 ↓ ④ 运行小型实验以验证 ↓(回到 ②) 每个任务都是一个进化。它不会随着使用变得更加昂贵 —— 它变得更加准确。
合同 名称:sharpagent-self-evolving 版本:1.0.0 类别:工作流程 信任级别:已验证 读取:- 任务 - 学习条目 - 五因素结果 写入:- 学习条目 - 改进假设 前置条件:- “存在已完成的任务以进行反思” - “可以读取任务输出和日志” 后置条件:- “反思产生至少 1 个改进假设” - “如果假设是可验证的,则设计实验” - “实验结果记录为学习条目” 校准: 默认模式:专业 支持模式:[专业,深度] 合规性: 管辖权:全球 安全级别:标准 生命周期: 状态:活动 发布为:SharpAgent 生命周期 4 阶段进化循环 ┌─────────────────────────────────────────────┐ │ │ │ [1. 反思] → [2. 假设] │ │ ↑ ↓ │ │ [4. 吸收] ← [3. 实验] │ │ │ └─────────────────────────────────────────────┘
第 1 阶段:反思 — 分析 在每个任务之后进行结构化反思。 何时:每个任务完成(强制) 主要错误中任务(强制深度模式) 每日总结(可选,合并多个反思) 反思框架: ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ Task 反思 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 任务:{任务名称} 持续时间:{持续时间} 什么做得对? - {2-3 个具体、可量化的东西} 什么可以改进? - {1-3 个可以改进的东西} 清楚的错误? - {如果有:描述 + 根本原因 + 影响} 学到的教训 - {一个句子的教训} 改进假设 - {一个明确、可验证的假设} 五因素审查嵌入: 如果任务涉及信息判断,请运行每个实践和教训通过五个因素: 是否我的来源可信? 是否我的推理链完整? 合规性检查? 是否在所选方向上存在偏见? 是否有其他来源需要交叉验证?
第 2 阶段:假设 — 形成假设 改进想法,形成可验证的假设。 假设格式: 如果 [我改变方法],则 [预期改进],因为 [原因] 好的与坏的假设: 坏的 “下次写得更好” “如果我在写作前规划大纲 30 秒,标题质量提高 20%” “检查更多来源” “如果我在决定前检查 2 个独立来源,交叉验证分数提高 15%” “不要再犯那个错误” “如果我在提交前添加合同验证,错误率降低 30%” 假设等级: 等级 含义 操作 关键改进,快速(<5 分钟) 立即实验 有价值,中等努力(<30 分钟) 排队实验 长期,重大投资 记录,实验时可能 如果反思没有产生改进假设 → 检查是否真正没有改进的空间。90% 的时间,反思没有足够诚实。
第 3 阶段:实验 — 验证 这是从 autoresearch(karpathy/autoresearch ⭐80K)借鉴的核心。 不要相信直觉认为某事物是“更好的” —— 运行一个小型实验来证明它。 实验循环(借用 autoresearch 的 5 分钟固定预算): 实验: 预算:5 分钟 # 固定时间预算 假设:“...” # 要验证的假设 设置:# 实验设置 - 控制:旧方法 - 处理:新方法 测量:# 指标 - 指标 1:“完成时间” - 指标 2:“错误率” - 指标 3:“质量分数” 结果:# 填写实验后 - 指标 1:旧 = 12 秒,新 = 8 秒 结论:# 结论 - 假设支持:真 / 假 - 采用:是 / 否 / 部分 - 备注:“” 实验类型: 类型 描述 预算 A/B 比较 运行旧方法与新方法,比较结果 5 分钟 去除一个步骤以查看影响 5 分钟 边界测试 测试边缘条件下的稳定性 3 分钟 交叉验证 不同来源 / 方法以确保一致性 5 分钟 实验纪律: 写下假设...