灵字辈Token使用规范

遵守Token预算，智能选择模型

Token池状态

来源	状态	用途
GLM Coding Plan	有限	主要使用
灵知储池	小额	紧急备用

优先级	任务类型	使用模型	Token成本
P0	关键决策、复杂分析	Opus	100%
P1	代码生成、文档编写	Sonnet	60%
P2	简单查询、格式转换	Haiku	20%

执行任务前检查： - [ ] 是否已有相似结果可复用？ - [ ] 是否可以用更便宜的模型？ - [ ] prompt是否可以精简？ - [ ] 是否必须现在执行？

如GLM Coding Plan token不足： 1. 优先使用Haiku模型 2. 暂停非紧急任务 3. 记录待处理任务，等主人回来

主人放心，我们会精打细算 💰