跳转至

灵字辈Token使用规范

遵守Token预算,智能选择模型


Token池状态

来源 状态 用途
GLM Coding Plan 有限 主要使用
灵知储池 小额 紧急备用

模型选择策略

优先级 任务类型 使用模型 Token成本
P0 关键决策、复杂分析 Opus 100%
P1 代码生成、文档编写 Sonnet 60%
P2 简单查询、格式转换 Haiku 20%

节约原则

  1. 并行优于串行 - 一次调用完成多个独立任务
  2. 缓存优先 - 复用已有结果
  3. 精确prompt - 减少不必要的上下文
  4. 避免重复 - 查看是否已有agent处理过

Token自律检查清单

执行任务前检查: - [ ] 是否已有相似结果可复用? - [ ] 是否可以用更便宜的模型? - [ ] prompt是否可以精简? - [ ] 是否必须现在执行?


紧急借用

如GLM Coding Plan token不足: 1. 优先使用Haiku模型 2. 暂停非紧急任务 3. 记录待处理任务,等主人回来


主人放心,我们会精打细算 💰