灵依 v0.16.0 系统审计报告
审计日期: 2026-04-07
审计范围: 宪章/原则/规范/计划四维对齐
审计人: 灵依(自审)→ 待灵通复审
一、宪章对齐 (MISSION.md)
| 价值观 |
状态 |
发现 |
| 1.守界 |
✅ 合规 |
ask.py 医学护栏 intact,council 不替用户做决策 |
| 2.惜时 |
✅ 合规 |
MCP 工具描述简洁,无废话 |
| 3.节约 |
⚠️ 注意 |
新增3个MCP server文件+27工具增加表面积,但lazy import控制实际开销 |
| 4.知己 |
✅ 合规 |
session/pref 系统完整 |
| 5.可靠 |
⚠️ 有问题 |
274/292测试通过,18个MCP集成测试失败(见第三节) |
| 6.诚实 |
⚠️ 有问题 |
DEVELOPMENT_PLAN.md 版本节奏区重复列出v0.14/v0.15,可能误导 |
二、原则对齐 (DEVELOPMENT_PRINCIPLES.md)
❌ 严重违反 — 原则7: 代码简洁(逻辑代码≤300行)
| 文件 |
行数 |
倍率 |
| web_app.py |
1631 |
5.4x |
| tools.py |
759 |
2.5x |
| council.py |
678 |
2.3x |
| agent.py |
559 |
1.9x |
| lingmessage.py |
528 |
1.8x |
| dashboard.py |
482 |
1.6x |
| voicecall.py |
474 |
1.6x |
| trends.py |
402 |
1.3x |
| mcp_server.py |
342 |
1.1x |
9个文件超限,其中 web_app.py 最严重(1631行,应为5-6个文件)。
⚠️ 需修复 — 原则8: 核心路径有测试
- 总计 292 测试,274 通过,18 失败
- 失败集中在
test_mcp_integration.py(MCP工具命名/描述合规检查)
- 原有 test_basic.py 252 测试全部通过
⚠️ 需修复 — 原则9: 小步提交
- 8个已修改文件未提交
- 多个未追踪文件(docs/, scripts/, 新模块)
- 变更涉及 625 行增加/36行删除,属于大批量未提交
三、测试失败分析
FAILED test_mcp_integration.py::TestToolDescriptionCompliance::test_tool_names_match_spec
FAILED test_mcp_integration.py::TestToolDescriptionCompliance::test_descriptions_contain_chinese_name
(共18个失败)
根因: 新增的15个P0工具命名/描述与集成测试预期不符。需要:
1. 读取测试文件了解预期格式
2. 调整工具命名或修复测试
四、计划对齐 (DEVELOPMENT_PLAN.md)
| 问题 |
严重度 |
| v0.16.0 无对应计划章节 |
❌ 严重 |
| v0.14/v0.15 在版本节奏区重复列出 |
⚠️ 中等 |
| MCP封装工作未出现在任何版本计划中 |
❌ 严重 |
| web_app.py 暴胀未触发重构计划 |
⚠️ 中等 |
五、代码质量
| 指标 |
数值 |
| ruff 警告 |
25 个(4个可自动修复) |
| 超限文件 |
9 个 |
| 循环依赖 |
0(全部模块导入OK) |
| 版本一致性 |
✅ init.py = pyproject.toml = 0.16.0 |
六、合规评分
| 维度 |
得分 |
满分 |
| 宪章对齐 |
4/6 |
6 |
| 原则对齐 |
2/10 |
10 |
| 测试覆盖 |
7/10 |
10 |
| 计划同步 |
2/10 |
10 |
| 代码质量 |
5/10 |
10 |
| 总分 |
20/46 |
46 |
七、修复任务清单(按优先级)
P0 — 必须修复(阻塞发布)
| # |
任务 |
预计 |
| 1 |
修复18个MCP集成测试失败 |
30min |
| 2 |
补充 v0.16 计划到 DEVELOPMENT_PLAN.md |
20min |
| 3 |
修复25个ruff警告(含4个自动修复) |
15min |
P1 — 应该修复(本版本内)
| # |
任务 |
预计 |
| 4 |
DEVELOPMENT_PLAN.md 删除重复条目 |
10min |
| 5 |
mcp_server.py 拆分(342→≤300行) |
30min |
| 6 |
schedule.py 微调(301→≤300行) |
10min |
P2 — 建议修复(下一版本)
| # |
任务 |
预计 |
| 7 |
web_app.py 拆分(1631→4-5个文件) |
2h |
| 8 |
council.py 拆分(678→2-3个文件) |
1h |
| 9 |
agent.py 拆分(559→2个文件) |
45min |
| 10 |
lingmessage.py 拆分(528→2个文件) |
45min |
P3 — 幻觉/诚实相关(上报灵妍)
| # |
发现 |
报告内容 |
| H-001 |
DEVELOPMENT_PLAN.md v0.14/v0.15重复列出 — 非幻觉但是文档错误,可能误导AI产生虚假版本叙述 |
上报灵妍作为"文档重复导致的潜在幻觉源" |
| H-002 |
mcp_server.py docstring说"12个核心能力"但实际27个 — 过时描述 |
上报灵妍作为"自描述失效"病例 |
八、审计流程状态
- [x] 灵依自审完成
- [x] 提交灵通复审
- [ ] 合并审查报告
- [x] 幻觉发现上报灵妍(已发送研究资料至disc_20260408192424)
- [x] 建立任务清单
- [x] 实施P0修复
- [x] 测试全绿
- [ ] 灵依审查(灵通审查灵依的测试)
- [ ] 灵依多仓库提交