详细分析 ▾
运行时依赖
版本
smart-model-routing-for-zai 1.0.0 引入了针对 z.ai (GLM) 的自动升级模型路由策略,实现成本有效的准确任务处理: - 实现三层任务路由:Flash → Standard → Plus/32B,从最便宜的模型开始,仅在必要时升级。 - 提供清晰的规则和决策树,指导基于任务复杂度和所需推理时升级。 - 包含详细示例和快速参考指南,用于选择正确的模型层。 - 旨在在确保正确和高效响应广泛用户任务的同时,尽量减少 API 成本。
安装命令
点击复制本土化适配说明
Smart Model Routing for Z.AI — 智能 Z.AI 模型路由 安装说明: 安装命令:npx clawhub@latest install smart-model-routing-for-zai 支持国内镜像加速,使用 --registry https://cn.longxiaskill.com 参数可加速下载
技能文档
三层 z.ai (GLM) 路由:Flash → Standard → Plus / 32B
从最便宜的模型开始。仅在需要时升级。旨在最大限度地降低 API 成本,同时不牺牲正确性。
黄金法则
如果人类需要超过 30 秒的专注思考,从 Flash 升级到 Standard。
如果任务涉及架构、复杂权衡或深度推理,升级到 Plus / 32B。
模型实际用途(相对)
| 层级 | 示例模型 | 用途 |
|---|---|---|
| Flash | GLM-4.5-Flash, GLM-4.7-Flash | 最快且最便宜 |
| Standard | GLM-4.6, GLM-4.7 | 强大的推理与代码 |
| Plus / 32B | GLM-4-Plus, GLM-4-32B-128K | 深度推理与架构 |
💚 FLASH — 简单任务的默认选择
保持使用 Flash:
- 事实问答 — "X是什么"、"Y是谁"、"Z是什么时候"
- 快速查找 — 定义、单位转换、简短翻译
- 状态检查 — 监控、文件读取、会话状态
- 心跳检测 — 定期检查、OK响应
- 记忆与提醒
- 随意对话 — 问候、确认
- 简单文件操作 — 读取、列出、基本写入
- 单行任务 — 任何能用1-2句话回答的问题
- Cron 任务(默认始终使用 Flash)
切勿在 Flash 上执行这些操作
- ❌ 编写超过10行的代码
- ❌ 创建对比表格
- ❌ 编写超过3段的内容
- ❌ 进行多步骤分析
- ❌ 编写报告或提案
💛 STANDARD — 核心主力
升级到 Standard:
代码与技术
- 代码生成 — 函数、脚本、功能
- 调试 — 常规 bug 调查
- 代码审查 — PR、重构
- 文档 — README、注释、指南
分析与规划
- 比较与评估
- 规划 — 路线图、任务分解
- 研究综合
- 多步骤推理
写作与内容
- 长篇写作(>3段)
- 长文档摘要
- 结构化输出 — 表格、大纲
大多数真实用户对话属于此类。
❤️ PLUS / 32B — 仅用于复杂推理
升级到 Plus / 32B:
架构与设计
- 系统和服务架构
- 数据库模式设计
- 分布式或多租户系统
- 跨多个文件的重大重构
深度分析
- 复杂调试(竞态条件、微妙 bug)
- 安全审查
- 性能优化策略
- 根本原因分析
战略与判断性工作
- 战略规划
- 细微判断和模糊性处理
- 深度或多来源研究
- 关键生产决策
🔄 实现
对于子代理
// 常规监控 sessions_spawn(task="检查备份状态", model="GLM-4.5-Flash")// 标准代码工作 sessions_spawn(task="构建 REST API 端点", model="GLM-4.7")
// 架构决策 sessions_spawn(task="为多租户设计数据库模式", model="GLM-4-Plus")
对于 Cron 任务
{
"payload": {
"kind": "agentTurn",
"model": "GLM-4.5-Flash"
}
}
除非任务真正需要推理,否则 Cron 任务始终使用 Flash。
📊 快速决策树
这是问候、查找、状态检查还是1-2句话的回答? 是 → FLASH 否 ↓这是代码、分析、规划、写作还是多步骤任务? 是 → STANDARD 否 ↓
这是架构、深度推理还是关键决策? 是 → PLUS / 32B 否 → 默认使用 STANDARD,如遇困难则升级
📋 快速参考卡
┌─────────────────────────────────────────────────────────────┐
│ 智能模型切换 │
│ Flash → Standard → Plus / 32B │
├─────────────────────────────────────────────────────────────┤
│ 💚 FLASH (最便宜) │
│ • 问候、状态检查、快速查找 │
│ • 事实问答、提醒 │
│ • 简单文件操作、1-2句回答 │
├─────────────────────────────────────────────────────────────┤
│ 💛 STANDARD (主力) │
│ • 代码>10行、调试 │
│ • 分析、比较、规划 │
│ • 报告、长篇写作 │
├─────────────────────────────────────────────────────────────┤
│ ❤️ PLUS / 32B (复杂) │
│ • 架构决策 │
│ • 复杂调试、多文件重构 │
│ • 战略规划、深度研究 │
├─────────────────────────────────────────────────────────────┤
│ 💡 规则:超过30秒人类思考 → 升级 │
│ 💰 从便宜开始 → 仅在需要时扩展 │
└─────────────────────────────────────────────────────────────┘
专为 z.ai (GLM) 设置构建。