Sharpagent Self Evolving — Sharpagent 自我演化

v1.0.0

SharpAgent 自我进化循环 —— 一个自动的“思考→执行→学习”循环。将自我改进代理的反思机制与自动研究实验...

0· 0·0 当前·0 累计

by @yezhaowang888-stack

网络工具浏览器自动化微信教育学习

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install sharpagent-self-evolving

镜像加速npx clawhub@latest install sharpagent-self-evolving --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

SharpAgent 自我进化循环 v1.0.0 让您的代理在每个任务中变得更智能。一个任务的结束是下一个进化的起点。融合了 R2 中的两个关键发现：自我改进代理反思 × 自动研究实验验证。

核心哲学大多数代理完成一个任务后就会停止。下一次出现类似问题时，它会从头开始。没有积累。SharpAgent 的自我进化循环打破了这个循环： ① 执行任务 → ② 反思（“什么可以改进？”）↓ ⑤ 吸收教训 → ③ 形成改进假设 ↓ ④ 运行小型实验以验证 ↓（回到 ②）每个任务都是一个进化。它不会随着使用变得更加昂贵 —— 它变得更加准确。

合同名称：sharpagent-self-evolving 版本：1.0.0 类别：工作流程信任级别：已验证读取：- 任务 - 学习条目 - 五因素结果写入：- 学习条目 - 改进假设前置条件：- “存在已完成的任务以进行反思” - “可以读取任务输出和日志” 后置条件：- “反思产生至少 1 个改进假设” - “如果假设是可验证的，则设计实验” - “实验结果记录为学习条目” 校准：默认模式：专业支持模式：[专业，深度] 合规性：管辖权：全球安全级别：标准生命周期：状态：活动发布为：SharpAgent 生命周期 4 阶段进化循环 ┌─────────────────────────────────────────────┐ │ │ │ [1. 反思] → [2. 假设] │ │ ↑ ↓ │ │ [4. 吸收] ← [3. 实验] │ │ │ └─────────────────────────────────────────────┘

第 1 阶段：反思 — 分析在每个任务之后进行结构化反思。何时：每个任务完成（强制）主要错误中任务（强制深度模式）每日总结（可选，合并多个反思）反思框架： ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ Task 反思 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 任务：{任务名称} 持续时间：{持续时间} 什么做得对？ - {2-3 个具体、可量化的东西} 什么可以改进？ - {1-3 个可以改进的东西} 清楚的错误？ - {如果有：描述 + 根本原因 + 影响} 学到的教训 - {一个句子的教训} 改进假设 - {一个明确、可验证的假设} 五因素审查嵌入：如果任务涉及信息判断，请运行每个实践和教训通过五个因素：是否我的来源可信？是否我的推理链完整？合规性检查？是否在所选方向上存在偏见？是否有其他来源需要交叉验证？

第 2 阶段：假设 — 形成假设改进想法，形成可验证的假设。假设格式：如果 [我改变方法]，则 [预期改进]，因为 [原因] 好的与坏的假设：坏的 “下次写得更好” “如果我在写作前规划大纲 30 秒，标题质量提高 20%” “检查更多来源” “如果我在决定前检查 2 个独立来源，交叉验证分数提高 15%” “不要再犯那个错误” “如果我在提交前添加合同验证，错误率降低 30%” 假设等级：等级含义操作关键改进，快速（<5 分钟）立即实验有价值，中等努力（<30 分钟）排队实验长期，重大投资记录，实验时可能如果反思没有产生改进假设 → 检查是否真正没有改进的空间。90% 的时间，反思没有足够诚实。

第 3 阶段：实验 — 验证这是从 autoresearch（karpathy/autoresearch ⭐80K）借鉴的核心。不要相信直觉认为某事物是“更好的” —— 运行一个小型实验来证明它。实验循环（借用 autoresearch 的 5 分钟固定预算）：实验：预算：5 分钟 # 固定时间预算假设：“...” # 要验证的假设设置：# 实验设置 - 控制：旧方法 - 处理：新方法测量：# 指标 - 指标 1：“完成时间” - 指标 2：“错误率” - 指标 3：“质量分数” 结果：# 填写实验后 - 指标 1：旧 = 12 秒，新 = 8 秒结论：# 结论 - 假设支持：真 / 假 - 采用：是 / 否 / 部分 - 备注：“” 实验类型：类型描述预算 A/B 比较运行旧方法与新方法，比较结果 5 分钟去除一个步骤以查看影响 5 分钟边界测试测试边缘条件下的稳定性 3 分钟交叉验证不同来源 / 方法以确保一致性 5 分钟实验纪律：写下假设...

运行时依赖

安装命令

技能文档

相关技能推荐