📦 Agent — 智能体

Name: Agent — 智能体
Rating: 13

v1.0.0

性能分析器：分析 AI 智能体的响应时间、token 用量与工具调用效率，提供可执行的优化建议以提升性能并降低成本。

13· 11·1 当前·1 累计

by @sky-lv (SKY-lv)

数据与API 数据库文件处理 AI模型访问安全

下载技能包

最后更新

2026/4/23

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

medium confidence

该技能的要求和说明符合性能分析目的，但运行时指令对收集、存储或传输的对话/工具数据描述模糊——安装前请审查数据范围和调用行为。

评估建议

该技能声称的功能是：测量响应延迟、token 用量与工具调用模式并提供优化建议；无安装脚本，也不索取凭据。安装前，请与技能作者确认以下细节，或在安全环境中测试： - 数据范围：技能为分析 agent 会读取哪些输入？（完整对话历史、最近 N 轮、工具调用轨迹、外部日志？） - 数据留存/传输：分析结果存于何处或发往何处？报告仅本地保存还是上传外部端点？分析前是否清除 PII 或机密数据？ - 调用行为：技能是检测到关键词即自动运行，还是仅显式调用？若为自动，请先关闭自主触发，直至确认安全默认设置。 - 访问控制：能否先限定技能仅分析合成或脱敏会话？若无法获得上述答案，请仅在非敏感测试数据上手动运行。若答案满意，则该技能对其宣称目的而言比例适当、逻辑一致。...

详细分析 ▾

✓ 用途与能力

名称/描述（agent profiling、token/cost optimization、tool-call analysis）与 SKILL.md 内容一致；不请求无关的二进制文件、凭据或配置路径；声明的范围与 skill 所宣称的测量与建议内容相符。

ℹ 指令范围

SKILL.md 提供了用于分析 agent trace 与会话历史的性能指标、测试用例及伪代码（如 profile_agent、analyze_tool_calls）。虽然这符合性能分析的预期，但文档对具体读取哪些数据源（完整聊天记录、tool 载荷、外部日志）以及是否会传输或持久化数据表述模糊，这种不确定性增加了收集敏感用户内容的风险。

✓ 安装机制

仅含指令的技能，无安装规范、无代码文件。安装风险最低——安装器不会下载或写入任何内容。

✓ 凭证需求

无需环境变量、凭据或配置路径。声明的需求与 profiling 工具相称。然而，profiling 隐式需要访问对话/工具追踪；SKILL.md 未枚举访问控制或限制。

ℹ 持久化与权限

always:false（正常）。该技能声明了触发词，并允许被自主调用（disable-model-invocation:false，这是平台默认设置）。结合不明确的数据范围，自动触发可能导致意外的对话画像或工具调用——建议限制自动调用或确认所捕获/保留的数据内容。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/23

- Agent Performance Profiler 首次发布。 - 深入分析 agent 响应时间、token 消耗及工具调用效率。 - 提供可执行的优化建议，附带清晰指标、基准与流程。 - 内置性能分析、提示优化与工具调用分析函数。 - 支持通过性能关键词与命令自动或手动触发。

● 无害

安装命令

点击复制

官方npx clawhub@latest install agent-performance-profiler

镜像加速npx clawhub@latest install agent-performance-profiler --registry https://cn.longxiaskill.com

技能文档

功能说明

深度分析 AI Agent 性能，包括响应时间、Token 消耗、工具调用效率，提供可执行优化建议，让 Agent 更快、更省、更稳。

核心指标

1. 响应时间

yaml  
metrics:  
  - first_token_latency: 首 Token 延迟（目标：<500ms）  
  - total_response_time: 总响应时间（目标：<3s）  
  - time_to_first_byte: 首字节时间  
  - streaming_latency: 流式延迟  
benchmarks:  
  - simple_query: <1s  
  - complex_task: <5s  
  - multi_tool: <10s

  
2. Token 消耗

yaml  
metrics:  
  - input_tokens: 输入 Token 数  
  - output_tokens: 输出 Token 数  
  - total_tokens: 总 Token 数  
  - cost_per_request: 单次请求成本  
optimization:  
  - prompt_compression: 提示词压缩  
  - context_pruning: 上下文裁剪  
  - response_summarization: 响应摘要

  
3. 工具调用效率

yaml  
metrics:  
  - tool_call_count: 工具调用次数  
  - tool_success_rate: 工具成功率（目标：>95%）  
  - redundant_calls: 冗余调用数  
  - parallel_opportunities: 可并行机会  
optimization:  
  - batch_calls: 批量调用  
  - cache_results: 缓存结果  
  - parallel_execution: 并行执行

  
4. 错误率

yaml  
metrics:  
  - api_error_rate: API 错误率（目标：<1%）  
  - timeout_rate: 超时率（目标：<2%）  
  - retry_rate: 重试率（目标：<5%）  
alerts:  
  - error_spike: 错误率突增  
  - latency_spike: 延迟突增  
  - cost_spike: 成本突增

  
性能分析流程  
1. 基线测试

yaml  
test_cases:  
  - simple_qa: 简单问答  
  - multi_step: 多步任务  
  - tool_intensive: 工具密集型  
  - context_heavy: 重上下文  
metrics_collected:  
  - response_time  
  - token_usage  
  - tool_calls  
  - error_rate

  
2. 瓶颈识别

yaml  
common_bottlenecks:  
  - verbose_prompts: 提示词过长  
  - redundant_tool_calls: 冗余工具调用  
  - sequential_execution: 顺序执行（可并行）  
  - context_bloat: 上下文膨胀  
  - inefficient_retries: 低效重试

  
3. 优化建议

yaml  
optimization_strategies:  
  - prompt_optimization:  
    - 移除冗余描述  
    - 使用结构化输出  
    - 添加示例（few-shot）  
  - tool_optimization:  
    - 批量调用  
    - 结果缓存  
    - 并行执行  
  - context_optimization:  
    - 相关性过滤  
    - 摘要压缩  
    - 向量检索

  
优化技巧  
提示词优化  
❌ 低效：

  
你是一个很有帮助的 AI 助手，你需要帮助用户完成各种任务。  
请仔细阅读用户的问题，然后思考如何解决。  
你需要考虑各种因素，包括...（冗长描述）

  
✅ 高效：

  
角色：{专业角色}  
任务：{具体任务}  
输出格式：{JSON/Markdown/列表}  
约束：{限制条件}

  
效果： Token 减少 60%，响应时间减少 40%  
工具调用优化  
❌ 低效（顺序调用）：

  
搜索 A  
搜索 B  
搜索 C  
合并结果

  
✅ 高效（并行调用）：

  
并行：  
  - 搜索 A  
  - 搜索 B  
  - 搜索 C  
合并结果

  
效果： 响应时间减少 70%  
上下文优化  
❌ 低效（完整历史）：

  
[完整对话历史，5000+ Token]

  
✅ 高效（相关性过滤）：

  
[最近 5 轮对话]  
[相关记忆摘要，500 Token]

  
效果： Token 减少 80%，成本减少 80%  
工具函数  
profile_agent

python  
def profile_agent(task: str, iterations: int = 10) -> dict:  
    """Agent 性能分析  
    Args:  
        task: 测试任务  
        iterations: 测试迭代次数  
    Returns:  
        {  
            "avg_response_time": 1.23,  # 秒  
            "p95_response_time": 2.45,  
            "avg_tokens": 450,  
            "avg_cost": 0.002,  # 美元  
            "tool_calls": 3.2,  # 平均每次  
            "error_rate": 0.02  # 2%  
        }  
    """

  
optimize_prompt

python  
def optimize_prompt(prompt: str) -> dict:  
    """提示词优化  
    Args:  
        prompt: 原始提示词  
    Returns:  
        {  
            "original_tokens": 500,  
            "optimized_tokens": 200,  
            "reduction": 0.6,  
            "optimized_prompt": "优化后的提示词",  
            "changes": ["移除冗余", "结构化", "添加示例"]  
        }  
    """

  
analyze_tool_calls

python  
def analyze_tool_calls(trace: list) -> dict:  
    """工具调用分析  
    Args:  
        trace: 工具调用追踪  
    Returns:  
        {  
            "total_calls": 15,  
            "redundant_calls": 3,  
            "parallel_opportunities": 2,  
            "cache_hits": 5,  
            "optimization_suggestions": [  
                "合并 A 和 B 调用",  
                "并行执行 C 和 D",  
                "缓存 E 的结果"  
            ]  
        }  
    """

  
性能基准  
优秀 Agent 标准  
| 指标       | 优秀     | 良好      | 需优化   |  
|------------|----------|-----------|----------|  
| 响应时间   | <1s      | 1-3s      | >3s      |  
| Token 效率 | <300     | 300-800   | >800     |  
| 工具成功率 | >98%     | 95-98%    | <95%     |  
| 成本/请求  | <$0.001  | $0.001-0.005 | >$0.005 |  
成本计算

yaml  
模型定价（参考）:  
  - GPT-4: $0.03/1K input, $0.06/1K output  
  - Claude-Sonnet: $0.003/1K input, $0.015/1K output  
  - Qwen-Plus: ¥0.004/1K input, ¥0.012/1K output

示例: 输入 500 Token + 输出 300 Token GPT-4 成本：$0.033 Claude-Sonnet 成本：$0.006 Qwen-Plus 成本：¥0.0056``

触发词

自动：检测 performance、optimize、token、latency、profiling 相关关键词
手动：/agent-profiler, /performance-analysis, /optimize-agent
短语：性能分析、优化 Agent、Token

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

运行时依赖

版本

安装命令

技能文档

功能说明

核心指标

1. 响应时间

2. Token 消耗

3. 工具调用效率

4. 错误率

性能分析流程

1. 基线测试

2. 瓶颈识别

3. 优化建议

优化技巧

提示词优化

工具调用优化

上下文优化

工具函数

profile_agent

optimize_prompt

analyze_tool_calls

性能基准

优秀 Agent 标准

成本计算

相关文件

触发词