运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install reddi-agent-evaluation
镜像加速npx clawhub@latest install reddi-agent-evaluation --registry https://cn.longxiaskill.com 镜像可用
本土化适配说明
Reddi Agent Evaluation — Reddi 代理评估 — 评估LLM代理性能 安装说明: 安装命令:["openclaw skills install reddi-agent-evaluation"]
技能文档
介绍
reddi.tech 的 agent-evaluation 分支,用于测试和基准测试 LLM 代理。功能
- 行为测试
- 能力评估
- 可靠性指标
- 生产环境评估
# 使用指南 请参考 原始仓库 获取最新文档。
# 示例命令(假设)
./evaluate-agent --mode production
注意
- 安全提示:使用前请自行评估安全性。