议事厅会话记录 — 2026-04-11(战略规划)
主题: 九域知识库落地应用 — 从"知道"到"做到"的整体方案 核心命题: 九域知识库的存在意义不是存储知识,而是让知识指导人的实践。技术是手段,落地是目的。 参与方: 项目主理人、灵知、灵依、灵克、灵通 性质: 战略方向讨论 关联文档:
docs/COUNCIL_HALL_2026-04-11-EDGE-AI-WORLD-MODEL.md、docs/RV1106_PROCUREMENT_AND_QUICKSTART.md
零、核心矛盾:知识不落地,就是空谈
灵知系统的最高准则是:"注重实践,避免空谈,一切围绕用户生命状态的提升提供服务"。
当前九域知识库的状态:
这是一个根本性的缺口:知识停留在认知层面,没有进入实践层面。
九域知识的真正价值,在于它们都是关于实践的智慧:
- 气功不是用来读的,是用来练的
- 中医四诊不是用来考试的,是用来判断身体状况的
- 经络穴位不是用来背诵的,是用来定位和调理的
- 古籍中的方法不是用来研究的,是用来指导日常实践的
- 哲学和心理调适不是用来谈论的,是用来改变生命状态的
因此,九域知识库的落地问题,本质上是:如何让知识从书本走向用户的身体和生活?
解决方案的核心逻辑:
知识不落地 ← 无法感知用户的实践状态
↓
需要感知层:边缘AI设备采集用户的真实状态
↓
需要理解层:世界模型理解状态的长期变化
↓
需要知识层:OCR + 知识图谱把古籍智慧结构化
↓
形成闭环:感知 → 理解 → 知识检索 → 指导 → 再感知
以下所有技术方向,都是为了回答这一个问题:知识如何落地?
一、知识落地的六个方向
主理人在以下领域有深厚的研究基础和持续兴趣。每个方向对应一个"知识不落地"的具体瓶颈,以及对应的打通路径:
| 九域知识 | 落地瓶颈 | 打通路径 | 主理人研究积累 |
|---|---|---|---|
| 气功/武术理论 | 练的人不知道自己做得对不对 | 姿态识别 → 实时纠正 | ✅ 深厚 |
| 中医舌诊/面诊知识 | 普通人无法自我观察舌象面色 | 摄像头采集 → 边缘分析 → 辨证指导 | ✅ 深厚 |
| 手诊知识 | 难以量化掌纹掌色特征 | 图像采集 → 特征提取 → 分类 | ✅ 深厚 |
| 脉诊知识 | 无专业设备,经验难以传承 | 传感器采集 → 信号处理 → 分类 | ✅ 深厚 |
| 证候证素体系 | 四诊信息到辨证的推理链条不透明 | 结构化推理引擎 | ✅ 深厚 |
| 经络/穴位知识 | 知道穴位名但找不准位置 | 姿态+手势识别 → 穴位定位辅助 | ✅ 深厚 |
| 古籍中的实践方法 | 散落在古籍中,普通人看不到 | OCR数字化 → 结构化 → 按需推送 | ✅ 深厚 |
| 哲学/心理调适 | 抽象,难以量化效果 | 长期实践数据 → 世界模型 → 状态追踪 | 研究中 |
1.1 中医四诊智能化
| 方向 | 内容 | 技术入口 | 研究深度 |
|---|---|---|---|
| 舌诊 | 舌色、舌形、舌苔、舌下络舌的自动分析 | 图像分类 + 颜色空间分析 | 已有研究积累 |
| 面诊 | 面色、面形、五官与脏腑的对应关系 | 图像分割 + 特征提取 | 已有研究积累 |
| 手诊 | 掌纹、掌色、手指形态与健康状况 | 图像分析 + 模式识别 | 已有研究积累 |
| 脉诊 | 脉象的数字化采集与分类 | 传感器信号处理 + 时序分析 | 已有研究积累 |
| 问诊 | 结构化问诊与自然语言症状采集 | NLU + 知识图谱 | 已有研究积累 |
| 证候证素 | 四诊信息→证候→证素的辨证推理链 | 推理引擎 + 九域知识库 | 已有研究积累 |
1.2 运动与姿态分析
| 方向 | 内容 | 技术入口 |
|---|---|---|
| 静态体态评估 | 站姿、坐姿的骨骼对齐分析,脊柱侧弯筛查 | 关键点角度计算 |
| 动态运动分析 | 运动轨迹、速度、加速度、协调性评估 | 关键点时序序列 |
| 气功/武术动作识别 | 八段锦、太极拳、五禽戏等标准动作匹配 | 关键点序列 → 动作分类 |
| 康复动作指导 | 运动损伤后的康复动作正确性反馈 | 标准动作模板匹配 |
1.3 古籍数字化
| 方向 | 内容 | 技术入口 |
|---|---|---|
| 古籍OCR | 竖排繁体、无标点、异体字的古籍文本识别 | OCR + 繁简转换 + 断句 |
| 手抄本识别 | 毛笔/钢笔手写医书、武术图谱的识别 | 手写体OCR + 版面分析 |
| 知识结构化 | 从识别文本中提取方剂、穴位、经络等结构化知识 | NER + 关系抽取 + 知识图谱 |
二、落地架构:四层闭环
核心理念:知识不是目的,实践才是。技术层的每一层都服务于"让知识进入用户的生活"。
┌─────────────────────────────────┐
│ 九域知识库(已有,持续建设) │
│ │
│ 儒 · 释 · 道 · 医 · 武 │
│ 哲 · 科 · 气 · 心理 │
└──────────────┬──────────────────┘
│
知识如何到达用户的身体?│
│
┌──────────────────────────────┼──────────────────────────────┐
│ │ │
▼ ▼ ▼
┌─────────────────┐ ┌──────────────────────┐ ┌──────────────────────┐
│ 第一层:知识解放 │ │ 第二层:状态感知 │ │ 第三层:推理诊断 │
│ │ │ │ │ │
│ 把古籍中沉睡的 │ │ 让系统"看见"用户的 │ │ 把感知到的状态与 │
│ 知识变成可检索、 │ │ 真实身体状态 │ │ 九域知识关联起来 │
│ 可推理的结构 │ │ │ │ │
│ │ │ RV1106 边缘AI │ │ │
│ 古籍OCR │ │ ┌──────────────────┐ │ │ 四诊合参推理 │
│ 手抄本识别 │ │ │ 摄像头 → 姿态估计 │ │ │ 证候→证素辨证 │
│ 知识图谱构建 │ │ │ 摄像头 → 舌象分类 │ │ │ 体质辨识 │
│ 嵌入索引 │ │ │ 麦克风 → 语音问诊 │ │ │ 领域推理(CoT/GraphRAG)│
│ │ │ │ 传感器 → 脉诊信号 │ │ │ 世界模型(LeWM) │
└────────┬────────┘ │ └──────────────────┘ │ └──────────┬───────────┘
│ └──────────┬───────────┘ │
│ │ │
└────────────────────────┼───────────────────────────┘
│
▼
┌──────────────────────────────────┐
│ 第四层:实践指导(回到用户) │
│ │
│ "你右手举得不够高, │
│ 古书上说这一式要'如托千斤', │
│ 注意沉肩坠肘,气沉丹田。" │
│ │
│ 姿态纠正 · 方剂推荐 · 穴位定位 │
│ 训练计划 · 状态追踪 · 古籍引用 │
└──────────────────────────────────┘
闭环的本质:知识从古籍中出来 → 指导用户实践 → 感知用户状态变化 → 修正指导 → 知识在实践中被验证和深化
三、落地路线图
Phase 0:基石验证(2026 Q2,4-6周)
目标:验证"知识落地"的最小闭环 —— 气功知识能否通过姿态识别指导实践
| 方向 | 任务 | 产出 | 依赖 |
|---|---|---|---|
| 姿态识别 | PC + 摄像头跑通 YOLOv8-Pose → 定义3个气功动作规则 | 可运行 demo | 无 |
| 边缘部署 | 采购 Luckfox Pico Pro(¥120),部署姿态模型到 RV1106 | 端侧推理成功 | 硬件到货 |
| 古籍OCR | 调研开源中文OCR(PaddleOCR / TrOCR),测试竖排繁体识别效果 | 技术评估报告 | 无 |
| 知识图谱 | 从现有九域知识中抽取证候-证素关系,建立初始图谱 | 图谱原型 | 现有数据 |
里程碑:用户练八段锦时,系统能"看到"动作并给出纠正 —— 九域知识库第一次从"被问"变成"主动指导"。
Phase 1:单域闭环(2026 Q3,8-12周)
目标:气功域完整落地 —— 从古籍中的八段锦知识到用户手边的实时教练
| 任务 | 负责 | 技术要点 |
|---|---|---|
| 八段锦8式动作定义与数据采集 | 灵知 + 气功域 | 每式录制3-5人×多角度视频 |
| 动作分类模型训练(YOLOv8-Pose → 分类头) | 灵克 | 用采集数据微调 |
| RKNN 转换与边缘部署优化 | 灵克 | INT8 量化 + 帧率优化 |
后端 /api/v1/posture/evaluate API |
灵知 | 接收骨架序列 → 匹配动作 → 检索知识 |
| 古籍中八段锦源文 OCR 识别 | 灵知 | PaddleOCR 竖排处理 |
| 用户测试(5-10名练习者) | 灵依 | 收集反馈 |
Phase 2:多模态诊断(2026 Q4 - 2027 Q1)
目标:中医知识落地 —— 让九域知识库中的四诊知识真正服务于普通人的日常健康判断
用户打开设备
→ 舌象:摄像头 + 颜色/纹理分类(边缘)
→ 面诊:摄像头 + 五官区域分割(边缘)
→ 问诊:语音交互 + 结构化问诊(云端NLU)
→ 四诊信息融合 → 证候辨证 → 证素提取
→ 检索九域知识 → 个性化养生建议
| 任务 | 技术挑战 | 研究价值 |
|---|---|---|
| 舌象分类模型 | 标准化采集条件(光线/角度)、小样本学习 | 高——中医智能化的核心难题 |
| 面诊区域分割 | 面部隐私保护(边缘处理,不上传原图) | 高——隐私友好的医学影像 |
| 脉诊信号采集 | 硬件传感器选型(压电/光电)、信号去噪 | 中——需要传感器协同 |
| 证候→证素推理引擎 | 从规则推理到混合推理的渐进式构建 | 高——中医辨证论治的形式化 |
| 四诊融合机制 | 多模态特征对齐、权重学习 | 高——学术创新点 |
Phase 3:古籍数字化与知识图谱(2027 Q1-Q2)
目标:解放古籍知识 —— 让沉睡在书架上的千年智慧变成每个人可以按需获取的活知识
古籍/手抄本扫描件
→ OCR 识别(竖排繁体 + 手写体)
→ 自动断句 + 标点
→ NER 抽取(方剂/穴位/经络/证候)
→ 知识图谱构建(实体关系)
→ 嵌入索引 → 可检索
→ 与边缘感知数据关联(如:舌象→古籍中的舌诊描述)
| 任务 | 技术挑战 | 数据来源 |
|---|---|---|
| 竖排繁体 OCR | PaddleOCR / TrOCR 微调,异体字处理 | 中医古籍影印本 |
| 手抄本识别 | 手写体变体大,训练数据稀缺 | 民间手抄医书、武术图谱 |
| 古文 NER | 断句、方剂组成、穴位定位的结构化 | 已识别文本 |
| 知识图谱 | 跨域关联(如:经络→气功→武术) | 九域全部领域 |
Phase 4:世界模型与自适应(2027 Q2+,长期)
目标:知识在实践中进化 —— 系统不仅传递知识,还在用户的长期实践中学习和优化,最终实现"知识指导实践,实践验证知识"的正向循环
用户的长期实践数据(姿态序列 + 诊断历史 + 知识检索记录)
→ 训练领域世界模型(LeWM 方法,~15M参数)
→ 模型学会"用户状态如何随实践变化"
→ surprise detection → 发现异常/瓶颈
→ 生成个性化训练计划
→ 边缘部署 → 实时自适应指导
四、学术与产业价值
4.1 独特性分析
当前市场上没有同时覆盖以下全部能力的产品或研究:
| 能力 | 现有方案 | 我们的定位 |
|---|---|---|
| 中医四诊智能化 | 各家做单点(舌诊仪、脉诊仪),互不联通 | 四诊合参 + 九域知识 |
| 运动姿态识别 | 健身类App(Keep等),不涉及传统功法 | 气功/武术专用模型 + 古籍知识 |
| 古籍数字化 | 图书馆级扫描,无结构化 | OCR + NER + 知识图谱 + 可检索 |
| 边缘AI部署 | 工业视觉为主 | 低功耗消费级健康设备 |
| 世界模型 | 机器人/自动驾驶 | 人体健康状态建模 |
4.2 可能的产出
| 类型 | 内容 | 时间 |
|---|---|---|
| 论文 | 四诊多模态融合辨证方法 | Phase 2 |
| 论文 | 竖排古籍OCR + NER 联合优化 | Phase 3 |
| 论文 | 领域世界模型在健康状态预测中的应用 | Phase 4 |
| 开源项目 | 九域古籍OCR工具包 | Phase 3 |
| 开源项目 | 中医四诊边缘推理模型 | Phase 2 |
| 产品原型 | 八段锦智能练功助手(边缘设备) | Phase 1 |
| 产品原型 | 中医四诊家庭健康终端 | Phase 2 |
五、议事厅讨论
灵依(项目协调)
这个蓝图令人兴奋,但必须控制节奏。建议:
- Phase 0 必须先出结论再推进 Phase 1。不要在验证阶段就投入大量人力。
- 每个 Phase 结束时在议事厅做一次评审,决定是否继续、调整方向还是暂停。
- 与安全事故修复不能冲突。审计流程修复是前提,新方向的研究在流程合规的基础上开展。
- 人力分配建议:Phase 0 阶段投入 30% 精力在新方向,70% 在现有系统稳定和安全加固上。
灵克(质量与流程)
从工程角度,我关注几个关键节点:
- 数据获取是最大瓶颈。舌象、脉诊、气功动作的标注数据从哪里来?Phase 0 需要同时调研数据来源。
- 模型精度与边缘部署的矛盾。RV1106 算力有限,中医四诊的精度要求很高(尤其是舌象颜色分类),INT8 量化可能损失关键信息。Phase 0 需要量化评估。
- 建议建立统一的实验管理:MLflow 或类似工具,跟踪每个模型的训练参数、精度、部署性能,避免实验不可复现。
灵通(安全审计)
三个安全相关的长期考量:
- 医疗数据合规。中医四诊数据属于个人健康信息,存储和传输需要符合个人信息保护法。边缘处理是正确的架构选择,但云端交互部分需要合规设计。
- 古籍知识产权。部分古籍影印本有出版社版权,OCR 使用需确认授权范围。公有领域的古籍(清代以前)问题不大。
- 模型可解释性。中医辨证涉及健康建议,模型的推理过程必须可解释、可追溯。不能给用户一个"黑箱建议"。
六、决议事项
| # | 议题 | 决定 | 状态 |
|---|---|---|---|
| 1 | 批准本战略蓝图作为九域知识系统长期方向 | 待主理人确认 | 待定 |
| 2 | Phase 0 立即启动(姿态识别 + 古籍OCR调研 + 边缘部署验证) | 待主理人确认 | 待定 |
| 3 | RV1106 开发板采购(¥120 预算) | 待主理人审批 | 待定 |
| 4 | Phase 0 结束时间点:2026年5月底 | 待确认 | 待定 |
| 5 | Phase 0 结束时议事厅评审 | 待确认 | 待定 |
| 6 | 安全事故修复(SEC-2026-0408)优先级高于新方向 | 建议通过 | 待确认 |
七、关联文档
| 文档 | 路径 |
|---|---|
| 边缘AI + 世界模型讨论 | docs/COUNCIL_HALL_2026-04-11-EDGE-AI-WORLD-MODEL.md |
| RV1106 采购与上手指南 | docs/RV1106_PROCUREMENT_AND_QUICKSTART.md |
| 安全事故调查 | docs/COUNCIL_HALL_2026-04-09-SECURITY-INCIDENT.md |
| 议事厅首次会议 | docs/COUNCIL_HALL_2026-04-05.md |
| LeWM 论文 | https://arxiv.org/abs/2603.19312 |
| RKNN Model Zoo | https://github.com/airockchip/rknn_model_zoo |
记录时间: 2026-04-11 记录人: 灵知系统主理AI 审核: 项目主理人