task-assessor — 任务评估员
v1.0.0任务难度与成本评估技能。当用户要求评估任务复杂度、所需时间、消耗成本或需要什么技能时激活。触发词包括"评估任务"、"难度分析"、"成本估算"、"需要多久"、"需要什么技能"、"任务规划"。 翻译后: 任务难度与成本评估技能。当用户要求评估任务复杂度、所需时间、消耗成本或需要什么技能时激活。触发词包括"评估任务"、"难度分析"、"成本估算"、"需要多久"、"需要什么技能"、"任务规划"。 最终答案: 任务难度与成本评估技能。当用户要求评估任务复杂度、所需时间、消耗成本或需要什么技能时激活。触发词包括"评估任务"、"难度分析"、"成本估算"、"需要多久"、"需要什么技能"、"任务规划"。 实际上,这段话已经是中文了,所以不需要翻译。
运行时依赖
安装命令
点击复制技能文档
Task Assessor 概述
当用户提出任务需求时,快速评估任务的难度等级、预估耗时、资源消耗,并给出清晰的结构化评估报告。
评估框架 任务复杂度等级 等级 标识 说明 典型场景 L1 🟢 简单 单次操作,5分钟内完成 查天气、读文件、发消息 L2 🟡 普通 需要几步操作,5-30分钟 批量重命名、分析单只股票 L3 🟠 复杂 多步骤或需要判断,30分钟-2小时 制作报告、分析多个标的 L4 🔴 困难 大量数据处理或跨系统操作,2小时以上 全量年报整理、多平台同步 L5 ⚫ 极高 需要持续维护或未知领域探索 全新系统搭建、未知技术调研 评估维度 每个任务从以下4个维度评估:
- 数据规模 — 多少数据量?(条数、文件数、涉及实体数)
- 操作复杂度 — 多少步骤?是否有分支判断?
- 依赖技能 — 需要哪些技能或工具?
- 时间消耗 — 大概多久?(初估 → 细估)
评估流程 Step 1: 理解任务本质
问自己:
用户想要什么最终结果? 现有技能能不能覆盖? 需要多少数据处理? Step 2: 确定复杂度等级 数据量 < 100条 → L1-L2 数据量 100-1000条 → L2-L3 数据量 > 1000条 → L3-L4
多步骤(>3步) → +1级 涉及外部API/跨系统 → +1级 需要判断/决策 → +1级
Step 3: 估算时间与成本 复杂度 时间估算 令牌消耗 L1 <5分钟 <10k L2 5-30分钟 10k-50k L3 30分钟-2小时 50k-200k L4 2-8小时 200k-500k L5 8小时以上 >500k Step 4: 输出评估报告
标准格式:
📋 任务评估报告
任务: [简述] 复杂度: L[X] [等级名称]
规模数据
- 数据量:
- 涉及范围:
难度分析
[分析难点在哪里]预估耗时
- 初估:[时间]
- 细估:[时间]
资源消耗
- 令牌估算:[X]k-[X]k
- 成本估算:$X.XX
所需技能
- 已有:
- 需要补充:
执行建议
[是否建议分批、如何优化]⚠️ 风险提示
[可能的卡点或问题]快速查表 用户需求 默认等级 典型耗时 "帮我查天气" L1 <1分钟 "帮我分析贵州茅台" L2 5-15分钟 "帮我做个PPT" L3 30-60分钟 "整理所有A股年报" L5 数天-数周 "给我解释这个概念" L1 <5分钟 "帮我写个方案" L3 30-120分钟 特殊规则 当数据规模不明确时
先给出一个范围估算,然后问用户确认具体规模:
"初估L3,但需要确认:你说的'所有数据'大概是多少条?"
当任务涉及多个子任务时
拆解为独立评估,汇总给出总评:
"这个任务可以拆成3个子任务: ① 数据清洗(L2) ② 格式转换(L3) ③ 报告生成(L2) 整体难度:L3,耗时约1小时"
当用户要求"顺便做一下"时
温和指出隐性工作量:
"这个'顺便'其实涉及:X步骤、Y数据量,可能比主任务还复杂"
参考资料
详细评估方法论和案例 → 见 references/assessment-methodo记录y.md 评估报告模板 → 见 references/assessment-template.md 常见任务基准数据 → 见 references/task-benchmarks.md