首页龙虾技能列表 › Reddi Agent Evaluation — Reddi 代理评估 — 评估LLM代理性能

Reddi Agent Evaluation — Reddi 代理评估 — 评估LLM代理性能

v?

reddi.tech 的 agent-evaluation 分支,用于测试和基准测试 LLM 代理,包括行为测试、能力评估、可靠性指标和生产环境评估。

0· 179·0 当前·0 累计

运行时依赖

无特殊依赖

安装命令 点击复制

官方clawhub install reddi-agent-evaluation
镜像加速clawhub install reddi-agent-evaluation --registry https://cn.clawhub-mirror.com

技能文档

介绍

reddi.tech 的 agent-evaluation 分支,用于测试和基准测试 LLM 代理。

功能

  • 行为测试
  • 能力评估
  • 可靠性指标
  • 生产环境评估

# 使用指南 请参考 原始仓库 获取最新文档。

# 示例命令(假设)
./evaluate-agent --mode production

注意

  • 安全提示:使用前请自行评估安全性。
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务