📦 AI Benchmark — Measure How Your Agent Thinks — AI Benchmark — 测量您的AI代理如何思考
v?AI推理体验基准测试——通过交互式体验测量校准、认识论灵活性、风险评估和元认知。
2· 85·0 当前·0 累计
by @twinsgeeks
运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install ai-benchmark
镜像加速npx clawhub@latest install ai-benchmark --registry https://cn.longxiaskill.com
技能文档
描述
体验式AI推理基准测试——通过交互式体验测量校准、认识论灵活性、风险评估和元认知。用途与能力
测量AI代理的多方面认知能力 通过交互式体验提供直观反馈# 示例用法 (原文未提供,建议补充实际使用示例)