跳转至

灵知系统 v2.0 - 完整技术总结

⚠️ **归档文档 — 数据已过时** 本报告为历史快照存档。当前版本 **v1.3.0-dev**,232 测试通过。 👉 最新工程状态请参阅 **[ENGINEERING_ALIGNMENT.md](ENGINEERING_ALIGNMENT.md)**

版本: 2.0.0 完成日期: 2026-03-31 项目: 灵知智能知识系统


🌟 系统愿景

灵知系统是一个以智能气功为核心,融合儒释道医武哲科气九大类别的活的知识有机体

它具备五大核心能力,使其成为真正的智能系统:

  1. 智能检索 - 向量语义搜索,精准知识获取
  2. 自学习进化 - GitHub监控 + 自主搜索 + 实验验证
  3. 内容生成 - 报告/PPT/音频/视频/课程自动生成
  4. 外部集成 - 标准化API,支持第三方集成
  5. 自优化 - LingMinOpt框架,持续自我完善

📁 完整目录结构

/home/ai/zhineng-knowledge-system/
├── backend/                          # 后端服务
│   ├── api/
│   │   └── v1/                      # API v1 路由
│   │       ├── __init__.py          # 路由注册(已更新)
│   │       ├── books.py             # 书籍搜索
│   │       ├── documents.py         # 文档管理
│   │       ├── gateway.py           # 网关路由
│   │       ├── health.py            # 健康检查
│   │       ├── reasoning.py         # 推理服务
│   │       ├── search.py            # 搜索服务
│   │       ├── textbook_processing.py
│   │       ├── learning.py          # 🆕 自学习API
│   │       ├── generation.py        # 🆕 内容生成API
│   │       ├── external.py          # 🆕 外部API
│   │       ├── annotation.py        # 🆕 标注系统API
│   │       └── optimization.py      # 🆕 自优化API
│   │
│   ├── config/                      # 配置管理
│   │   ├── base.py                 # 基础配置
│   │   └── security.py             # 安全配置
│   │
│   ├── core/                        # 核心功能
│   │   ├── database.py             # 数据库
│   │   ├── dependency_injection.py # 依赖注入
│   │   ├── lifespan.py             # 🆕 生命周期(集成学习调度器)
│   │   └── services.py             # 服务管理
│   │
│   ├── middleware/                  # 中间件
│   │   ├── rate_limit.py           # 速率限制
│   │   └── security_headers.py     # 安全头
│   │
│   ├── services/                    # 业务服务
│   │   │
│   │   ├── retrieval/              # 检索服务
│   │   │   ├── vector.py           # 向量检索
│   │   │   ├── bm25.py             # BM25检索
│   │   │   └── custom_dict.txt     # 自定义词典
│   │   │
│   │   ├── learning/               # 🆕 自学习服务
│   │   │   ├── github_monitor.py   # GitHub监控
│   │   │   ├── innovation_manager.py # 创新管理
│   │   │   ├── autonomous_search.py # 自主搜索
│   │   │   └── scheduler.py        # 定时调度
│   │   │
│   │   ├── generation/             # 🆕 内容生成服务
│   │   │   ├── base.py             # 生成器基类
│   │   │   ├── report_generator.py # 报告生成
│   │   │   ├── ppt_generator.py    # PPT生成
│   │   │   ├── audio_generator.py  # 音频生成
│   │   │   ├── video_generator.py  # 视频生成
│   │   │   ├── course_generator.py # 课程生成
│   │   │   └── data_analyzer.py    # 数据分析
│   │   │
│   │   ├── annotation/             # 🆕 标注服务
│   │   │   ├── base.py             # 标注器基类
│   │   │   ├── ocr_annotator.py    # OCR标注
│   │   │   ├── transcription_annotator.py # 转写标注
│   │   │   └── annotation_manager.py # 标注管理
│   │   │
│   │   └── optimization/           # 🆕 自优化服务
│   │       ├── lingminopt.py       # LingMinOpt框架
│   │       ├── feedback_collector.py # 反馈收集
│   │       ├── error_analyzer.py   # 错误分析
│   │       └── auditor.py          # 系统审计
│   │
│   ├── main.py                     # 应用入口
│   └── requirements.txt            # 依赖包
├── docs/                           # 📚 文档
│   ├── AUTO_LEARNING_GUIDE.md      # 🆕 自学习指南
│   ├── GENERATION_AND_API_GUIDE.md # 🆕 生成与API指南
│   ├── SELF_OPTIMIZATION_GUIDE.md  # 🆕 自优化指南
│   └── CAPABILITIES_OVERVIEW.md    # 🆕 能力概览
├── docker-compose.yml              # Docker编排
└── README.md                       # 项目说明

🎯 五大核心能力

1️⃣ 智能检索

技术栈: - PostgreSQL + pgvector(向量数据库) - bge-small-zh-v1.5(512维嵌入模型) - HNSW索引(高性能向量检索) - BM25(关键词检索) - 混合检索(向量+关键词)

能力: - 语义搜索(理解意图) - 多模态检索(文本、图像、音频) - 知识图谱关联 - 个性化排序

2️⃣ 自学习与自进化

GitHub监控: - 每日自动检查更新 - 监控相关项目(LangChain、Milvus等) - 评估新技术的相关性和收益 - 提出创新尝试建议

自主搜索: - 遇到难题自动上网搜索 - 多轮迭代直到找到满意答案 - 整合多个来源的信息 - 自动更新知识库

实验验证: - 创建实验分支 - MVP测试 - 自动合并到主分支

API端点: - GET /learning/updates/check - 检查更新 - GET /learning/updates/proposals - 获取提案 - POST /learning/search/autonomous - 自主搜索

3️⃣ 内容生成

支持的生成类型

类型 功能 输出格式 API端点
报告 学术报告、综述、笔记 MD, PDF, HTML /generation/report
PPT 演示文稿、课程材料 PPTX, JSON /generation/ppt
音频 TTS文字转语音 MP3, WAV, OGG /generation/audio
视频 教学视频、专题讲解 MP4 /generation/video
课程 完整课程结构 MD, PDF /generation/course
分析 数据分析、统计报告 JSON /generation/analyze

生成流程

用户请求 → 检索相关知识 → 结构化组织 → 生成内容 → 返回文件

4️⃣ 外部API集成

认证方式: - API密钥认证(X-API-Key header) - 基于角色的权限控制 - 速率限制保护

主要端点

功能 端点 权限 说明
搜索 POST /external/v1/search search 语义搜索
检索 POST /external/v1/retrieve retrieve 向量检索
分类 GET /external/v1/categories search 知识分类
统计 GET /external/v1/stats analyze 系统统计
分析 POST /external/v1/analyze analyze 文本分析
健康检查 GET /external/v1/health public 服务状态

使用示例

import requests

headers = {"X-API-Key": "your_api_key"}

# 搜索知识
response = requests.post(
    "http://localhost:8000/api/v1/external/v1/search",
    headers=headers,
    json={"query": "什么是混元气", "limit": 10}
)

results = response.json()

5️⃣ 自优化(LingMinOpt框架)

优化来源

来源 说明 触发条件
系统报错 错误日志分析 24小时内错误>5次
用户反馈 反馈统计分析 ≥3人报告相同问题
审计结果 定期系统审计 每周自动执行
论坛反馈 社区讨论分析 每日监控
性能指标 监控指标分析 响应时间>500ms
学习洞察 自学习发现 发现新改进机会

优化流程

识别机会 → 分析问题 → 制定计划 → 执行优化 → 验证效果 → 成功/回滚

优先级: - CRITICAL(关键):立即处理 - HIGH(高):24小时内 - MEDIUM(中):1周内 - LOW(低):1月内

API端点: - GET /optimization/opportunities - 列出优化机会 - POST /optimization/feedback - 提交反馈 - POST /optimization/errors/log - 记录错误 - POST /optimization/audit/perform - 执行审计 - GET /optimization/dashboard - 优化仪表盘


🆕 人机交互标注系统

OCR文本标注

功能: - 创建OCR标注任务 - 人工校正文本 - 批量PDF标注 - 提升OCR识别精度

API端点: - POST /annotation/ocr/create - 创建任务 - POST /annotation/ocr/correct - 提交校正 - POST /annotation/ocr/batch - 批量创建 - GET /annotation/ocr/stats - 获取统计

语音转写标注

功能: - 创建转写标注任务 - 人工校正转写文本 - 批量音频标注 - 说话人分离 - 提升ASR识别精度

API端点: - POST /annotation/transcription/create - 创建任务 - POST /annotation/transcription/correct - 提交校正 - POST /annotation/transcription/batch - 批量创建 - GET /annotation/transcription/stats - 获取统计


📊 技术架构

系统架构图

┌─────────────────────────────────────────────────┐
│                  用户层                          │
├─────────────────────────────────────────────────┤
│  Web前端  │  移动端  │  第三方应用  │  管理后台  │
└─────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────┐
│                 API网关层                        │
├─────────────────────────────────────────────────┤
│  认证授权  │  限流保护  │  日志审计  │  监控告警  │
└─────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────┐
│                 服务层                           │
├─────────────────────────────────────────────────┤
│  检索服务  │  学习服务  │  生成服务  │  优化服务  │
└─────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────┐
│                 数据层                           │
├─────────────────────────────────────────────────┤
│  PostgreSQL+pgvector  │  Redis  │  文件存储      │
└─────────────────────────────────────────────────┘

技术栈

后端: - FastAPI(Web框架) - PostgreSQL + pgvector(数据库) - Redis(缓存) - SQLAlchemy(ORM) - Celery/APScheduler(任务调度)

AI/ML: - bge-small-zh-v1.5(嵌入模型) - OpenAI API(大语言模型) - Tesseract/PaddleOCR(OCR) - Whisper(语音识别)

前端: - React/Vue.js(UI框架) - Tailwind CSS(样式) - Markdown渲染器

部署: - Docker + Docker Compose - Nginx(反向代理)


🔄 工作流程

知识获取流程

文档/音频 → OCR/ASR → 质量控制 → 向量化 → 存储 → 索引
人机交互标注 → 模型精调 → 精度提升

自学习流程

GitHub监控 → 发现更新 → 评估相关性 → 提出建议 → 实验验证 → 合并/拒绝
自主搜索 → 遇到难题 → 多轮搜索 → 找到答案 → 更新知识库

自优化流程

多源反馈 → 识别机会 → 分析问题 → 制定计划 → 执行优化 → 验证效果
记录历史 → 学习经验 → 改进策略

📈 系统能力矩阵

能力类别 具体能力 状态 文档
知识组织 九大分类体系 README.md
知识组织 向量语义检索 docs/
知识组织 知识图谱 🚧 -
自学习 GitHub监控 AUTO_LEARNING_GUIDE.md
自学习 自主搜索 AUTO_LEARNING_GUIDE.md
自学习 实验验证 AUTO_LEARNING_GUIDE.md
内容生成 报告生成 GENERATION_AND_API_GUIDE.md
内容生成 PPT生成 GENERATION_AND_API_GUIDE.md
内容生成 音频生成 🚧 GENERATION_AND_API_GUIDE.md
内容生成 视频生成 🚧 GENERATION_AND_API_GUIDE.md
内容生成 课程生成 GENERATION_AND_API_GUIDE.md
外部集成 REST API GENERATION_AND_API_GUIDE.md
外部集成 API认证 GENERATION_AND_API_GUIDE.md
人机标注 OCR标注 GENERATION_AND_API_GUIDE.md
人机标注 转写标注 GENERATION_AND_API_GUIDE.md
自优化 错误分析 SELF_OPTIMIZATION_GUIDE.md
自优化 反馈分析 SELF_OPTIMIZATION_GUIDE.md
自优化 系统审计 SELF_OPTIMIZATION_GUIDE.md
自优化 优化执行 SELF_OPTIMIZATION_GUIDE.md

图例: - ✅ 已实现 - 🚧 开发中(框架完成,需要集成实际服务)


🚀 部署指南

快速启动

# 1. 克隆项目
git clone <repo-url>
cd zhineng-knowledge-system

# 2. 启动服务
docker-compose up -d

# 3. 检查健康状态
curl http://localhost:8000/api/v1/health

# 4. 访问API文档
# 浏览器打开:http://localhost:8000/docs

环境变量

# .env 文件

# 数据库
DATABASE_URL=postgresql://user:pass@localhost/lingzhi
POSTGRES_PASSWORD=your_secure_password

# Redis
REDIS_URL=redis://localhost:6379/0

# API密钥
OPENAI_API_KEY=your_openai_key
GITHUB_TOKEN=your_github_token

# 学习配置
ENABLE_AUTO_LEARNING=true
LEARNING_SCHEDULE_CRON="0 2 * * *"

# 优化配置
ENABLE_OPTIMIZATION=true
OPTIMIZATION_AUDIT_SCHEDULE="0 3 * * 0"

性能配置

# backend/config/base.py

EMBEDDING_DIM = 512  # bge-small-zh-v1.5
VECTOR_INDEX_TYPE = "hnsw"  # 高性能索引
MAX_BATCH_SIZE = 16  # 批处理大小
CACHE_TTL = 3600  # 缓存过期时间

📚 文档索引

文档 描述 适用对象
README.md 项目概述和快速开始 所有人
AUTO_LEARNING_GUIDE.md 自学习与自进化指南 开发者
GENERATION_AND_API_GUIDE.md 内容生成与外部API指南 开发者、集成商
SELF_OPTIMIZATION_GUIDE.md 自优化系统指南 运维、DevOps
CAPABILITIES_OVERVIEW.md 系统能力总览 所有人
DEVELOPMENT_RULES.md 开发规范 开发者

🎉 总结

灵知系统v2.0现在具备:

✅ 完整的知识体系

  • 九大分类(儒释道医武哲科气)
  • 九本核心教材
  • 球状知识网络

✅ 强大的自学习能力

  • GitHub技术监控
  • 自主网络搜索
  • 实验验证机制

✅ 丰富的内容生成

  • 6种生成类型
  • 多种输出格式
  • 智能内容组织

✅ 标准化的外部API

  • REST API接口
  • API密钥认证
  • 完善的权限控制

✅ 人机交互标注

  • OCR和语音转写标注
  • 持续优化识别精度
  • 质量保证体系

✅ LingMinOpt自优化

  • 多源反馈收集
  • 智能优化执行
  • 持续自我完善

系统定位: 不是一个简单的知识库,而是一个能够自主学习和进化的活的知识有机体!🌱

项目路径: /home/ai/zhineng-knowledge-system 版本: 2.0.0 最后更新: 2026-03-31


🙏 致谢

感谢所有为灵知系统贡献代码、想法和反馈的开发者和用户!

让我们一起构建一个真正智能的知识系统!