🧪 Axiomata 技能评估系统 — OpenClaw 代理的高级技能评估信息
值
版本 2.2.0 — 2026-05-07
状态
运行中 ✅
评估系统
双评估(Axioma 5维 + ISO 25010)
目标分数
70+(5维),90%+(ISO自动化),80+(手动)
目标
结合双评估系统(Axioma 5维 + ISO 25010)全面评估技能质量。
Axiomata 评估系统是自包含的,包含所有必需的工具和脚本。
使用时机
触发器
行动
"评估技能"
运行双评估系统
"发布前评估"
运行完整评估流程
"改进技能"
分析报告并修复问题
"技能审计"
执行完整审计
"检查技能质量"
运行自动化检查
Axiomata 设计原则
Axiomata = 自包含 + 通用 + 可改进
原则
描述
自包含
所有工具捆绑在技能内部
通用
适用于任何 OpenClaw 代理
可改进
提供 --improve 选项自动改进
╔═══════════════════════════════════════════════════════════╗
║ 双评估系统架构
╠═══════════════════════════════════════════════════════════╣
║
║
║ ┌─────────────────────────────────────────────────┐
║ ║ │ 1. Axioma 5维评估(100分) │
║ ║ │ │
║ ║ │ 维度:
║ │ ├─ Structure(结构) → 20%
║ │ ├─ Clarity(清晰度) → 20%
║ │ ├─ Completeness(完整性) → 20%
║ │ ├─ Consistency(一致性) → 20%
║ │ └─ Functionality(功能性) → 20%
║ ║ │ │
║ ║ │ 目标:70+ 分数 ✅
║ ║ └─────────────────────────────────────────────────┘
║ ║ ↓
║ ║ ┌─────────────────────────────────────────────────┐
║ ║ │ 2. ISO 25010 评估(100分) │
║ ║ │ │
║ ║ │ 类别:8个类别,25项标准
║ ║ │ 自动化检查:13项测试
║ ║ │ │
║ ║ │ 目标:自动化 90%+ ✅
║ ║ └─────────────────────────────────────────────────┘
║ ║ ↓
║ ║ ┌─────────────────────────────────────────────────┐
║ ║ │ 3. 手动评估(25项标准) │
║ ║ │ │
║ ║ │ 使用 25项标准评分表手动评估
║ ║ │ │
║ ║ │ 目标:80+ 分数
║ ║ └─────────────────────────────────────────────────┘
║ ║
╚═══════════════════════════════════════════════════════════╝
文件
系统
用途
evaluator.py
Axioma 5维
彩色5维评估,捆绑在 skills/axioma-skill-evaluator/
eval-skill.py
ISO 25010
自动结构检查(13项测试),捆绑在 skills/axioma-skill-evaluator/scripts/
references/rubric.md
评分表
25项标准手动评分表
工具路径
# evaluator.py 路径
/media/ezekiel/Merlin/.openclaw/workspace/skills/axioma-skill-evaluator/evaluator.py
# eval-skill.py 路径
/media/ezekiel/Merlin/.openclaw/workspace/skills/axioma-skill-evaluator/scripts/eval-skill.py
完整评估流程
# 1. Axioma 5维评估(带改进建议)
python3 /media/ezekiel/Merlin/.openclaw/workspace/skills/axioma-skill-evaluator/evaluator.py --verbose --improve
# 2. ISO 25010 自动化检查
python3 /media/ezekiel/Merlin/.openclaw/workspace/skills/axioma-skill-evaluator/scripts/eval-skill.py --verbose
单独运行
# 仅 Axioma 5维评估
python3 evaluator.py --verbose
# 仅 ISO 25010 检查
python3 eval-skill.py --verbose
# 带改进建议
python3 evaluator.py --improve
完整示例
# 评估 core-files-management
SKILL_PATH=/media/ezekiel/Merlin/.openclaw/workspace/skills/core-files-management
# 运行双评估
python3 evaluator.py $SKILL_PATH --verbose --improve
python3 eval-skill.py $SKILL_PATH --verbose
Structure(结构)— 20%
检查项
最高分
描述
Header /5
frontmatter 完整,包含 name 和 description
Sections /5
部分数量充足(至少3个主要部分)
Formatting /5
格式化质量(表格、列表、代码块)
Meta /5
元信息完整
Clarity(清晰度)— 20%
检查项
最高分
描述
Description /5
描述完整、清晰
Commands /5
命令存在且正确
Examples /5
示例存在且具体
Constraints /5
约束记录清楚
Completeness(完整性)— 20%
检查项
最高分
描述
Tools /5
工具记录完整
Prerequisites /5
前提条件明确
Errors /5
错误处理文档化
Edge Cases /5
边缘情况覆盖
Consistency(一致性)— 20%
检查项
最高分
描述
Axioma Alignment /5
Axiomata 系统对齐
Style /5
样式一致性
Naming /5
命名一致性
Integration /5
集成度
Functionality(功能性)— 20%
检查项
最高分
描述
Commands /10
命令语法正确
Results /5
结果正确性
Integration /5
集成功能
类别
最高分
检查项
功能适用性 /12
技能是否按描述工作
可靠性 /12
错误处理、稳定性
性能 /8
资源使用、响应时间
可用性(AI) /12
命令清晰度、结构化
可对用性(人类) /8
可读性、导航
安全性 /12
权限、安全检查
可维护性 /12
代码质量、文档
代理特定 /24
代理集成、Axiomata 对齐
系统
指标
目标
当前状态
Axioma 5维
总分
70+
✅ 达标
ISO 25010
自动化检查
90%+
⚠️ 需改进
手动
25项标准
80+
需手动检查
分数范围
状态
说明
90-100
🟢 优秀
卓越品质,准备发布
70-89
🟡 良好
通过,可以发布
50-69
🟠 需要工作
需要改进
0-49
🔴 不合格
严重问题,需要大量工作
低分修复指南
维度
低于15分时的修复
Structure
添加缺失部分、改进格式、确保 frontmatter 完整
Clarity
添加示例、命令、约束、改进描述
Completeness
添加工具、前提条件、错误处理、边缘情况
Consistency
添加 Axiomata 标记、样式一致性、统一命名
Functionality
修复命令语法、验证结果、测试集成
自动化检查失败
ISO 25010 失败检查项 → 对应修复:
- Frontmatter 缺失 → 添加完整的 ---
- 没有 description → 添加清晰的 description
- 没有 usage 部分 → 添加工具和使用说明
╔═══════════════════════════════════════════════════════════╗