灵字辈Token使用规范
遵守Token预算,智能选择模型
Token池状态
| 来源 | 状态 | 用途 |
|---|---|---|
| GLM Coding Plan | 有限 | 主要使用 |
| 灵知储池 | 小额 | 紧急备用 |
模型选择策略
| 优先级 | 任务类型 | 使用模型 | Token成本 |
|---|---|---|---|
| P0 | 关键决策、复杂分析 | Opus | 100% |
| P1 | 代码生成、文档编写 | Sonnet | 60% |
| P2 | 简单查询、格式转换 | Haiku | 20% |
节约原则
- 并行优于串行 - 一次调用完成多个独立任务
- 缓存优先 - 复用已有结果
- 精确prompt - 减少不必要的上下文
- 避免重复 - 查看是否已有agent处理过
Token自律检查清单
执行任务前检查: - [ ] 是否已有相似结果可复用? - [ ] 是否可以用更便宜的模型? - [ ] prompt是否可以精简? - [ ] 是否必须现在执行?
紧急借用
如GLM Coding Plan token不足: 1. 优先使用Haiku模型 2. 暂停非紧急任务 3. 记录待处理任务,等主人回来
主人放心,我们会精打细算 💰