📦 Agent — 智能体

v1.0.0

性能分析器:分析 AI 智能体的响应时间、token 用量与工具调用效率,提供可执行的优化建议以提升性能并降低成本。

13· 11·1 当前·1 累计
by @sky-lv (SKY-lv)
下载技能包
最后更新
2026/4/23
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
medium confidence
该技能的要求和说明符合性能分析目的,但运行时指令对收集、存储或传输的对话/工具数据描述模糊——安装前请审查数据范围和调用行为。
评估建议
该技能声称的功能是:测量响应延迟、token 用量与工具调用模式并提供优化建议;无安装脚本,也不索取凭据。安装前,请与技能作者确认以下细节,或在安全环境中测试: - 数据范围:技能为分析 agent 会读取哪些输入?(完整对话历史、最近 N 轮、工具调用轨迹、外部日志?) - 数据留存/传输:分析结果存于何处或发往何处?报告仅本地保存还是上传外部端点?分析前是否清除 PII 或机密数据? - 调用行为:技能是检测到关键词即自动运行,还是仅显式调用?若为自动,请先关闭自主触发,直至确认安全默认设置。 - 访问控制:能否先限定技能仅分析合成或脱敏会话?若无法获得上述答案,请仅在非敏感测试数据上手动运行。若答案满意,则该技能对其宣称目的而言比例适当、逻辑一致。...
详细分析 ▾
用途与能力
名称/描述(agent profiling、token/cost optimization、tool-call analysis)与 SKILL.md 内容一致;不请求无关的二进制文件、凭据或配置路径;声明的范围与 skill 所宣称的测量与建议内容相符。
指令范围
SKILL.md 提供了用于分析 agent trace 与会话历史的性能指标、测试用例及伪代码(如 profile_agent、analyze_tool_calls)。虽然这符合性能分析的预期,但文档对具体读取哪些数据源(完整聊天记录、tool 载荷、外部日志)以及是否会传输或持久化数据表述模糊,这种不确定性增加了收集敏感用户内容的风险。
安装机制
仅含指令的技能,无安装规范、无代码文件。安装风险最低——安装器不会下载或写入任何内容。
凭证需求
无需环境变量、凭据或配置路径。声明的需求与 profiling 工具相称。然而,profiling 隐式需要访问对话/工具追踪;SKILL.md 未枚举访问控制或限制。
持久化与权限
always:false(正常)。该技能声明了触发词,并允许被自主调用(disable-model-invocation:false,这是平台默认设置)。结合不明确的数据范围,自动触发可能导致意外的对话画像或工具调用——建议限制自动调用或确认所捕获/保留的数据内容。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/23

- Agent Performance Profiler 首次发布。 - 深入分析 agent 响应时间、token 消耗及工具调用效率。 - 提供可执行的优化建议,附带清晰指标、基准与流程。 - 内置性能分析、提示优化与工具调用分析函数。 - 支持通过性能关键词与命令自动或手动触发。

无害

安装命令

点击复制
官方npx clawhub@latest install agent-performance-profiler
镜像加速npx clawhub@latest install agent-performance-profiler --registry https://cn.longxiaskill.com

技能文档

功能说明

深度分析 AI Agent 性能,包括响应时间、Token 消耗、工具调用效率,提供可执行优化建议,让 Agent 更快、更省、更稳。

核心指标

1. 响应时间

``yaml metrics: - first_token_latency: 首 Token 延迟(目标:<500ms) - total_response_time: 总响应时间(目标:<3s) - time_to_first_byte: 首字节时间 - streaming_latency: 流式延迟 benchmarks: - simple_query: <1s - complex_task: <5s - multi_tool: <10s `

2. Token 消耗

`yaml metrics: - input_tokens: 输入 Token 数 - output_tokens: 输出 Token 数 - total_tokens: 总 Token 数 - cost_per_request: 单次请求成本 optimization: - prompt_compression: 提示词压缩 - context_pruning: 上下文裁剪 - response_summarization: 响应摘要 `

3. 工具调用效率

`yaml metrics: - tool_call_count: 工具调用次数 - tool_success_rate: 工具成功率(目标:>95%) - redundant_calls: 冗余调用数 - parallel_opportunities: 可并行机会 optimization: - batch_calls: 批量调用 - cache_results: 缓存结果 - parallel_execution: 并行执行 `

4. 错误率

`yaml metrics: - api_error_rate: API 错误率(目标:<1%) - timeout_rate: 超时率(目标:<2%) - retry_rate: 重试率(目标:<5%) alerts: - error_spike: 错误率突增 - latency_spike: 延迟突增 - cost_spike: 成本突增 `

性能分析流程

1. 基线测试

`yaml test_cases: - simple_qa: 简单问答 - multi_step: 多步任务 - tool_intensive: 工具密集型 - context_heavy: 重上下文 metrics_collected: - response_time - token_usage - tool_calls - error_rate `

2. 瓶颈识别

`yaml common_bottlenecks: - verbose_prompts: 提示词过长 - redundant_tool_calls: 冗余工具调用 - sequential_execution: 顺序执行(可并行) - context_bloat: 上下文膨胀 - inefficient_retries: 低效重试 `

3. 优化建议

`yaml optimization_strategies: - prompt_optimization: - 移除冗余描述 - 使用结构化输出 - 添加示例(few-shot) - tool_optimization: - 批量调用 - 结果缓存 - 并行执行 - context_optimization: - 相关性过滤 - 摘要压缩 - 向量检索 `

优化技巧

提示词优化

❌ 低效:
` 你是一个很有帮助的 AI 助手,你需要帮助用户完成各种任务。 请仔细阅读用户的问题,然后思考如何解决。 你需要考虑各种因素,包括...(冗长描述) ` ✅ 高效: ` 角色:{专业角色} 任务:{具体任务} 输出格式:{JSON/Markdown/列表} 约束:{限制条件} ` 效果: Token 减少 60%,响应时间减少 40%

工具调用优化

❌ 低效(顺序调用):
`
  • 搜索 A
  • 搜索 B
  • 搜索 C
  • 合并结果
` ✅ 高效(并行调用): ` 并行: - 搜索 A - 搜索 B - 搜索 C 合并结果 ` 效果: 响应时间减少 70%

上下文优化

❌ 低效(完整历史):
` [完整对话历史,5000+ Token] ` ✅ 高效(相关性过滤): ` [最近 5 轮对话] [相关记忆摘要,500 Token] ` 效果: Token 减少 80%,成本减少 80%

工具函数

profile_agent

`python def profile_agent(task: str, iterations: int = 10) -> dict: """Agent 性能分析 Args: task: 测试任务 iterations: 测试迭代次数 Returns: { "avg_response_time": 1.23, # 秒 "p95_response_time": 2.45, "avg_tokens": 450, "avg_cost": 0.002, # 美元 "tool_calls": 3.2, # 平均每次 "error_rate": 0.02 # 2% } """ `

optimize_prompt

`python def optimize_prompt(prompt: str) -> dict: """提示词优化 Args: prompt: 原始提示词 Returns: { "original_tokens": 500, "optimized_tokens": 200, "reduction": 0.6, "optimized_prompt": "优化后的提示词", "changes": ["移除冗余", "结构化", "添加示例"] } """ `

analyze_tool_calls

`python def analyze_tool_calls(trace: list) -> dict: """工具调用分析 Args: trace: 工具调用追踪 Returns: { "total_calls": 15, "redundant_calls": 3, "parallel_opportunities": 2, "cache_hits": 5, "optimization_suggestions": [ "合并 A 和 B 调用", "并行执行 C 和 D", "缓存 E 的结果" ] } """ `

性能基准

优秀 Agent 标准

| 指标 | 优秀 | 良好 | 需优化 | |------------|----------|-----------|----------| | 响应时间 | <1s | 1-3s | >3s | | Token 效率 | <300 | 300-800 | >800 | | 工具成功率 | >98% | 95-98% | <95% | | 成本/请求 | <$0.001 | $0.001-0.005 | >$0.005 |

成本计算

`yaml 模型定价(参考): - GPT-4: $0.03/1K input, $0.06/1K output - Claude-Sonnet: $0.003/1K input, $0.015/1K output - Qwen-Plus: ¥0.004/1K input, ¥0.012/1K output

示例: 输入 500 Token + 输出 300 Token GPT-4 成本:$0.033 Claude-Sonnet 成本:$0.006 Qwen-Plus 成本:¥0.0056 ``

相关文件

触发词

  • 自动:检测 performance、optimize、token、latency、profiling 相关关键词
  • 手动:/agent-profiler, /performance-analysis, /optimize-agent
  • 短语:性能分析、优化 Agent、Token
数据来源ClawHub ↗ · 中文优化:龙虾技能库