智能知识系统 - 规划严格审查报告
⚠️ **归档文档 — 数据已过时**
本报告为历史快照存档。当前版本 **v1.3.0-dev**,232 测试通过。
👉 最新工程状态请参阅 **[ENGINEERING_ALIGNMENT.md](ENGINEERING_ALIGNMENT.md)**
审查日期: 2026-03-25
审查依据: Week 1 实际开发经验
审查人: LingFlow 自动审查系统
执行摘要
| 项目 |
原规划 |
实际情况 |
评估 |
| 总时间 |
30-45天 |
待验证 |
⚠️ 可能低估 |
| Week 1 |
3-5天 |
~1天(实际) |
⚠️ 估算不准确 |
| 阶段数 |
7个 |
过多 |
❌ 建议精简 |
总体评价: 规划过于理想化,需要大幅调整
问题清单
🔴 严重问题
| 问题 |
影响 |
建议 |
| 阶段划分过细 |
增加管理复杂度 |
合并阶段 |
| 数据来源不明确 |
无法验证功能 |
优先解决数据问题 |
| 技术选型过多 |
学习成本高 |
精简技术栈 |
| 单人开发考虑不足 |
时间估算不准 |
调整为单人适配 |
🟡 中等问题
| 问题 |
影响 |
建议 |
| 端口冲突假设 |
部署困难 |
提前检查端口 |
| Docker 版本兼容 |
环境问题 |
固定版本 |
| 测试框架依赖 |
额外配置 |
简化测试 |
Week 1 实际数据
时间分解
项目初始化 : ~30分钟
Docker 配置调试 : ~1小时 (端口冲突)
后端 API 开发 : ~1小时
前端页面开发 : ~30分钟
测试编写和调试 : ~1小时
代码审查和优化 : ~30分钟
---------------------------
总计 : ~4小时
实际文件结构 vs 规划
| 规划 |
实际 |
差异 |
| phase1-mvp/ |
zhineng-knowledge-system/ |
结构不同 |
| 多个 Python 文件 |
单个 main.py |
简化了 |
| 复杂前端框架 |
纯 HTML/JS |
简化了 |
修订建议
建议的新规划结构
阶段 1: MVP + 基础数据 (1-2天) ✅ 已完成
├── PostgreSQL + FastAPI
├── 基础 CRUD API
├── 简单搜索
└── Web 界面
阶段 2: 向量检索 (2-3天)
├── pgvector 配置
├── BGE 嵌入 (API)
├── 向量检索
└── 测试验证
阶段 3: RAG 问答 (2-3天)
├── LLM 集成 (DeepSeek)
├── Prompt 工程
├── 文档上传
└── 前端对话界面
阶段 4: 数据迁移 (1-2天)
├── ima 数据导出
├── 数据清洗
├── 批量导入
└── 验证
阶段 5: 优化上线 (2-3天)
├── 性能优化
├── 测试完善
├── 文档编写
└── 部署上线
---------------------------
总计: 8-13天 (更适合单人开发)
风险评估
高风险项
| 风险 |
概率 |
影响 |
缓解方案 |
| ima 数据无法获取 |
高 |
高 |
手动输入或用样本数据 |
| BGE API 稳定性 |
中 |
中 |
准备备选方案 |
| LLM API 成本 |
低 |
中 |
缓存+限流 |
低风险项
| 风险 |
理由 |
| PostgreSQL + pgvector |
成熟技术 |
| FastAPI |
简单可靠 |
| Docker 部署 |
已验证 |
技术栈审查
建议保留 ✅
| 技术 |
理由 |
| FastAPI |
简单高效,异步支持好 |
| PostgreSQL + pgvector |
一体化,运维简单 |
| Redis (已有) |
缓存必需 |
| Nginx |
反向代理标准 |
建议删除 ❌
| 技术 |
理由 |
| Node.js (前端) |
纯 HTML/JS 足够 |
| 复杂前端框架 |
单人维护成本高 |
| Celery (任务队列) |
MVP 不需要 |
| MinIO (存储) |
对象存储非必需 |
建议延迟 ⏳
| 技术 |
理由 |
| Neo4j (图谱) |
GraphRAG 可以后期添加 |
| Grafana |
监控可以简化 |
| API Gateway |
单服务不需要 |
数据策略审查
当前问题
- ima 知识库数据无法直接获取
- 需要微信扫码
-
API 访问受限
-
样本数据不足
- 只有 6 条测试数据
- 无法验证检索效果
建议方案
方案 A: 手动迁移 (推荐)
1. 从 ima 复制粘贴内容
2. 使用迁移工具导入
3. 预计时间: 2-4小时
方案 B: 使用样本数据扩展
1. 从公开源收集
2. 手动整理录入
3. 预计时间: 1-2天
方案 C: API 自动化 (需要授权)
1. 获取 ima API 访问
2. 编写爬虫脚本
3. 预计时间: 4-8小时
时间估算审查
原规划 vs 实际
| 阶段 |
原估算 |
修正估算 |
变化原因 |
| Week 1 |
3-5天 |
1天 |
任务简化 |
| Week 2 |
5-7天 |
2-3天 |
使用 API 而非本地模型 |
| Week 3 |
5-7天 |
2-3天 |
简化前端 |
| Week 4 |
7-10天 |
删除 |
功能过于复杂 |
| Week 5 |
5-7天 |
删除 |
单服务不需要网关 |
| Week 6 |
5-7天 |
2-3天 |
简化监控 |
新估算
阶段 1 (MVP) : ✅ 已完成
阶段 2 (向量检索) : 2-3天
阶段 3 (RAG) : 2-3天
阶段 4 (数据迁移) : 1-2天
阶段 5 (优化上线) : 2-3天
---------------------------
总计 : 9-14天 (约2周)
修订后的规划
见下一节: PHASED_IMPLEMENTATION_PLAN_V2.md
审查结论
需要立即调整
- ✅ 合并阶段 - 从 7 个减少到 5 个
- ✅ 简化技术栈 - 移除非必需组件
- ✅ 解决数据问题 - 优先迁移 ima 数据
- ✅ 调整时间估算 - 基于实际单人开发速度
可以保持
- ✅ 核心技术选型 (FastAPI, PostgreSQL, pgvector)
- ✅ 增量式开发理念
- ✅ Docker 部署方式
- ✅ 测试驱动方法
下一步行动
- 创建修订版规划文件
- 确认 ima 数据迁移方案
- 开始阶段 2 (向量检索)