跳转至

智能知识系统 - 规划严格审查报告

⚠️ **归档文档 — 数据已过时** 本报告为历史快照存档。当前版本 **v1.3.0-dev**,232 测试通过。 👉 最新工程状态请参阅 **[ENGINEERING_ALIGNMENT.md](ENGINEERING_ALIGNMENT.md)**

审查日期: 2026-03-25
审查依据: Week 1 实际开发经验
审查人: LingFlow 自动审查系统


执行摘要

项目 原规划 实际情况 评估
总时间 30-45天 待验证 ⚠️ 可能低估
Week 1 3-5天 ~1天(实际) ⚠️ 估算不准确
阶段数 7个 过多 ❌ 建议精简

总体评价: 规划过于理想化,需要大幅调整


问题清单

🔴 严重问题

问题 影响 建议
阶段划分过细 增加管理复杂度 合并阶段
数据来源不明确 无法验证功能 优先解决数据问题
技术选型过多 学习成本高 精简技术栈
单人开发考虑不足 时间估算不准 调整为单人适配

🟡 中等问题

问题 影响 建议
端口冲突假设 部署困难 提前检查端口
Docker 版本兼容 环境问题 固定版本
测试框架依赖 额外配置 简化测试

Week 1 实际数据

时间分解

项目初始化        : ~30分钟
Docker 配置调试   : ~1小时 (端口冲突)
后端 API 开发     : ~1小时  
前端页面开发      : ~30分钟
测试编写和调试    : ~1小时
代码审查和优化    : ~30分钟
---------------------------
总计              : ~4小时

实际文件结构 vs 规划

规划 实际 差异
phase1-mvp/ zhineng-knowledge-system/ 结构不同
多个 Python 文件 单个 main.py 简化了
复杂前端框架 纯 HTML/JS 简化了

修订建议

建议的新规划结构

阶段 1: MVP + 基础数据 (1-2天)  ✅ 已完成
├── PostgreSQL + FastAPI
├── 基础 CRUD API
├── 简单搜索
└── Web 界面

阶段 2: 向量检索 (2-3天)
├── pgvector 配置
├── BGE 嵌入 (API)
├── 向量检索
└── 测试验证

阶段 3: RAG 问答 (2-3天)
├── LLM 集成 (DeepSeek)
├── Prompt 工程
├── 文档上传
└── 前端对话界面

阶段 4: 数据迁移 (1-2天)
├── ima 数据导出
├── 数据清洗
├── 批量导入
└── 验证

阶段 5: 优化上线 (2-3天)
├── 性能优化
├── 测试完善
├── 文档编写
└── 部署上线
---------------------------
总计: 8-13天 (更适合单人开发)

风险评估

高风险项

风险 概率 影响 缓解方案
ima 数据无法获取 手动输入或用样本数据
BGE API 稳定性 准备备选方案
LLM API 成本 缓存+限流

低风险项

风险 理由
PostgreSQL + pgvector 成熟技术
FastAPI 简单可靠
Docker 部署 已验证

技术栈审查

建议保留 ✅

技术 理由
FastAPI 简单高效,异步支持好
PostgreSQL + pgvector 一体化,运维简单
Redis (已有) 缓存必需
Nginx 反向代理标准

建议删除 ❌

技术 理由
Node.js (前端) 纯 HTML/JS 足够
复杂前端框架 单人维护成本高
Celery (任务队列) MVP 不需要
MinIO (存储) 对象存储非必需

建议延迟 ⏳

技术 理由
Neo4j (图谱) GraphRAG 可以后期添加
Grafana 监控可以简化
API Gateway 单服务不需要

数据策略审查

当前问题

  1. ima 知识库数据无法直接获取
  2. 需要微信扫码
  3. API 访问受限

  4. 样本数据不足

  5. 只有 6 条测试数据
  6. 无法验证检索效果

建议方案

方案 A: 手动迁移 (推荐)

1. 从 ima 复制粘贴内容
2. 使用迁移工具导入
3. 预计时间: 2-4小时

方案 B: 使用样本数据扩展

1. 从公开源收集
2. 手动整理录入
3. 预计时间: 1-2天

方案 C: API 自动化 (需要授权)

1. 获取 ima API 访问
2. 编写爬虫脚本
3. 预计时间: 4-8小时


时间估算审查

原规划 vs 实际

阶段 原估算 修正估算 变化原因
Week 1 3-5天 1天 任务简化
Week 2 5-7天 2-3天 使用 API 而非本地模型
Week 3 5-7天 2-3天 简化前端
Week 4 7-10天 删除 功能过于复杂
Week 5 5-7天 删除 单服务不需要网关
Week 6 5-7天 2-3天 简化监控

新估算

阶段 1 (MVP)      : ✅ 已完成
阶段 2 (向量检索) : 2-3天
阶段 3 (RAG)     : 2-3天  
阶段 4 (数据迁移) : 1-2天
阶段 5 (优化上线) : 2-3天
---------------------------
总计             : 9-14天 (约2周)

修订后的规划

见下一节: PHASED_IMPLEMENTATION_PLAN_V2.md


审查结论

需要立即调整

  1. 合并阶段 - 从 7 个减少到 5 个
  2. 简化技术栈 - 移除非必需组件
  3. 解决数据问题 - 优先迁移 ima 数据
  4. 调整时间估算 - 基于实际单人开发速度

可以保持

  1. ✅ 核心技术选型 (FastAPI, PostgreSQL, pgvector)
  2. ✅ 增量式开发理念
  3. ✅ Docker 部署方式
  4. ✅ 测试驱动方法

下一步行动

  1. 创建修订版规划文件
  2. 确认 ima 数据迁移方案
  3. 开始阶段 2 (向量检索)