跳转至

议事厅会话记录 — 2026-04-11(战略规划)

主题: 九域知识库落地应用 — 从"知道"到"做到"的整体方案 核心命题: 九域知识库的存在意义不是存储知识,而是让知识指导人的实践。技术是手段,落地是目的。 参与方: 项目主理人、灵知、灵依、灵克、灵通 性质: 战略方向讨论 关联文档: docs/COUNCIL_HALL_2026-04-11-EDGE-AI-WORLD-MODEL.mddocs/RV1106_PROCUREMENT_AND_QUICKSTART.md


零、核心矛盾:知识不落地,就是空谈

灵知系统的最高准则是:"注重实践,避免空谈,一切围绕用户生命状态的提升提供服务"

当前九域知识库的状态:

用户问一个问题 → 系统检索知识 → 返回一段文字
                      用户"知道"了
                      但做到没有?不知道。
                      做得对不对?不知道。
                      状态有没有改善?不知道。

这是一个根本性的缺口:知识停留在认知层面,没有进入实践层面

九域知识的真正价值,在于它们都是关于实践的智慧

  • 气功不是用来读的,是用来练的
  • 中医四诊不是用来考试的,是用来判断身体状况的
  • 经络穴位不是用来背诵的,是用来定位和调理的
  • 古籍中的方法不是用来研究的,是用来指导日常实践的
  • 哲学和心理调适不是用来谈论的,是用来改变生命状态的

因此,九域知识库的落地问题,本质上是:如何让知识从书本走向用户的身体和生活?

解决方案的核心逻辑:

知识不落地 ← 无法感知用户的实践状态
需要感知层:边缘AI设备采集用户的真实状态
需要理解层:世界模型理解状态的长期变化
需要知识层:OCR + 知识图谱把古籍智慧结构化
形成闭环:感知 → 理解 → 知识检索 → 指导 → 再感知

以下所有技术方向,都是为了回答这一个问题:知识如何落地?


一、知识落地的六个方向

主理人在以下领域有深厚的研究基础和持续兴趣。每个方向对应一个"知识不落地"的具体瓶颈,以及对应的打通路径:

九域知识 落地瓶颈 打通路径 主理人研究积累
气功/武术理论 练的人不知道自己做得对不对 姿态识别 → 实时纠正 ✅ 深厚
中医舌诊/面诊知识 普通人无法自我观察舌象面色 摄像头采集 → 边缘分析 → 辨证指导 ✅ 深厚
手诊知识 难以量化掌纹掌色特征 图像采集 → 特征提取 → 分类 ✅ 深厚
脉诊知识 无专业设备,经验难以传承 传感器采集 → 信号处理 → 分类 ✅ 深厚
证候证素体系 四诊信息到辨证的推理链条不透明 结构化推理引擎 ✅ 深厚
经络/穴位知识 知道穴位名但找不准位置 姿态+手势识别 → 穴位定位辅助 ✅ 深厚
古籍中的实践方法 散落在古籍中,普通人看不到 OCR数字化 → 结构化 → 按需推送 ✅ 深厚
哲学/心理调适 抽象,难以量化效果 长期实践数据 → 世界模型 → 状态追踪 研究中

1.1 中医四诊智能化

方向 内容 技术入口 研究深度
舌诊 舌色、舌形、舌苔、舌下络舌的自动分析 图像分类 + 颜色空间分析 已有研究积累
面诊 面色、面形、五官与脏腑的对应关系 图像分割 + 特征提取 已有研究积累
手诊 掌纹、掌色、手指形态与健康状况 图像分析 + 模式识别 已有研究积累
脉诊 脉象的数字化采集与分类 传感器信号处理 + 时序分析 已有研究积累
问诊 结构化问诊与自然语言症状采集 NLU + 知识图谱 已有研究积累
证候证素 四诊信息→证候→证素的辨证推理链 推理引擎 + 九域知识库 已有研究积累

1.2 运动与姿态分析

方向 内容 技术入口
静态体态评估 站姿、坐姿的骨骼对齐分析,脊柱侧弯筛查 关键点角度计算
动态运动分析 运动轨迹、速度、加速度、协调性评估 关键点时序序列
气功/武术动作识别 八段锦、太极拳、五禽戏等标准动作匹配 关键点序列 → 动作分类
康复动作指导 运动损伤后的康复动作正确性反馈 标准动作模板匹配

1.3 古籍数字化

方向 内容 技术入口
古籍OCR 竖排繁体、无标点、异体字的古籍文本识别 OCR + 繁简转换 + 断句
手抄本识别 毛笔/钢笔手写医书、武术图谱的识别 手写体OCR + 版面分析
知识结构化 从识别文本中提取方剂、穴位、经络等结构化知识 NER + 关系抽取 + 知识图谱

二、落地架构:四层闭环

核心理念:知识不是目的,实践才是。技术层的每一层都服务于"让知识进入用户的生活"。

                         ┌─────────────────────────────────┐
                         │     九域知识库(已有,持续建设)    │
                         │                                 │
                         │  儒 · 释 · 道 · 医 · 武          │
                         │  哲 · 科 · 气 · 心理              │
                         └──────────────┬──────────────────┘
                    知识如何到达用户的身体?│
         ┌──────────────────────────────┼──────────────────────────────┐
         │                              │                              │
         ▼                              ▼                              ▼
┌─────────────────┐    ┌──────────────────────┐    ┌──────────────────────┐
│ 第一层:知识解放  │    │ 第二层:状态感知       │    │ 第三层:推理诊断      │
│                 │    │                      │    │                      │
│ 把古籍中沉睡的   │    │ 让系统"看见"用户的    │    │ 把感知到的状态与      │
│ 知识变成可检索、 │    │ 真实身体状态          │    │ 九域知识关联起来      │
│ 可推理的结构     │    │                      │    │                      │
│                 │    │ RV1106 边缘AI         │    │                      │
│ 古籍OCR         │    │ ┌──────────────────┐ │    │ 四诊合参推理          │
│ 手抄本识别       │    │ │ 摄像头 → 姿态估计 │ │    │ 证候→证素辨证        │
│ 知识图谱构建     │    │ │ 摄像头 → 舌象分类 │ │    │ 体质辨识              │
│ 嵌入索引         │    │ │ 麦克风 → 语音问诊 │ │    │ 领域推理(CoT/GraphRAG)│
│                 │    │ │ 传感器 → 脉诊信号 │ │    │ 世界模型(LeWM)        │
└────────┬────────┘    │ └──────────────────┘ │    └──────────┬───────────┘
         │             └──────────┬───────────┘               │
         │                        │                           │
         └────────────────────────┼───────────────────────────┘
                ┌──────────────────────────────────┐
                │     第四层:实践指导(回到用户)     │
                │                                  │
                │  "你右手举得不够高,                 │
                │   古书上说这一式要'如托千斤',       │
                │   注意沉肩坠肘,气沉丹田。"          │
                │                                  │
                │  姿态纠正 · 方剂推荐 · 穴位定位      │
                │  训练计划 · 状态追踪 · 古籍引用      │
                └──────────────────────────────────┘

闭环的本质:知识从古籍中出来 → 指导用户实践 → 感知用户状态变化 → 修正指导 → 知识在实践中被验证和深化


三、落地路线图

Phase 0:基石验证(2026 Q2,4-6周)

目标:验证"知识落地"的最小闭环 —— 气功知识能否通过姿态识别指导实践

方向 任务 产出 依赖
姿态识别 PC + 摄像头跑通 YOLOv8-Pose → 定义3个气功动作规则 可运行 demo
边缘部署 采购 Luckfox Pico Pro(¥120),部署姿态模型到 RV1106 端侧推理成功 硬件到货
古籍OCR 调研开源中文OCR(PaddleOCR / TrOCR),测试竖排繁体识别效果 技术评估报告
知识图谱 从现有九域知识中抽取证候-证素关系,建立初始图谱 图谱原型 现有数据

里程碑:用户练八段锦时,系统能"看到"动作并给出纠正 —— 九域知识库第一次从"被问"变成"主动指导"。

Phase 1:单域闭环(2026 Q3,8-12周)

目标:气功域完整落地 —— 从古籍中的八段锦知识到用户手边的实时教练

用户练八段锦
  → RV1106 识别动作(8式)
  → 上传关键点序列到灵知后端
  → 检索气功域知识(动作要领、呼吸配合、注意事项)
  → 返回个性化指导
  → 用户调整 → 循环
任务 负责 技术要点
八段锦8式动作定义与数据采集 灵知 + 气功域 每式录制3-5人×多角度视频
动作分类模型训练(YOLOv8-Pose → 分类头) 灵克 用采集数据微调
RKNN 转换与边缘部署优化 灵克 INT8 量化 + 帧率优化
后端 /api/v1/posture/evaluate API 灵知 接收骨架序列 → 匹配动作 → 检索知识
古籍中八段锦源文 OCR 识别 灵知 PaddleOCR 竖排处理
用户测试(5-10名练习者) 灵依 收集反馈

Phase 2:多模态诊断(2026 Q4 - 2027 Q1)

目标:中医知识落地 —— 让九域知识库中的四诊知识真正服务于普通人的日常健康判断

用户打开设备
  → 舌象:摄像头 + 颜色/纹理分类(边缘)
  → 面诊:摄像头 + 五官区域分割(边缘)
  → 问诊:语音交互 + 结构化问诊(云端NLU)
  → 四诊信息融合 → 证候辨证 → 证素提取
  → 检索九域知识 → 个性化养生建议
任务 技术挑战 研究价值
舌象分类模型 标准化采集条件(光线/角度)、小样本学习 高——中医智能化的核心难题
面诊区域分割 面部隐私保护(边缘处理,不上传原图) 高——隐私友好的医学影像
脉诊信号采集 硬件传感器选型(压电/光电)、信号去噪 中——需要传感器协同
证候→证素推理引擎 从规则推理到混合推理的渐进式构建 高——中医辨证论治的形式化
四诊融合机制 多模态特征对齐、权重学习 高——学术创新点

Phase 3:古籍数字化与知识图谱(2027 Q1-Q2)

目标:解放古籍知识 —— 让沉睡在书架上的千年智慧变成每个人可以按需获取的活知识

古籍/手抄本扫描件
  → OCR 识别(竖排繁体 + 手写体)
  → 自动断句 + 标点
  → NER 抽取(方剂/穴位/经络/证候)
  → 知识图谱构建(实体关系)
  → 嵌入索引 → 可检索
  → 与边缘感知数据关联(如:舌象→古籍中的舌诊描述)
任务 技术挑战 数据来源
竖排繁体 OCR PaddleOCR / TrOCR 微调,异体字处理 中医古籍影印本
手抄本识别 手写体变体大,训练数据稀缺 民间手抄医书、武术图谱
古文 NER 断句、方剂组成、穴位定位的结构化 已识别文本
知识图谱 跨域关联(如:经络→气功→武术) 九域全部领域

Phase 4:世界模型与自适应(2027 Q2+,长期)

目标:知识在实践中进化 —— 系统不仅传递知识,还在用户的长期实践中学习和优化,最终实现"知识指导实践,实践验证知识"的正向循环

用户的长期实践数据(姿态序列 + 诊断历史 + 知识检索记录)
  → 训练领域世界模型(LeWM 方法,~15M参数)
  → 模型学会"用户状态如何随实践变化"
  → surprise detection → 发现异常/瓶颈
  → 生成个性化训练计划
  → 边缘部署 → 实时自适应指导

四、学术与产业价值

4.1 独特性分析

当前市场上没有同时覆盖以下全部能力的产品或研究:

能力 现有方案 我们的定位
中医四诊智能化 各家做单点(舌诊仪、脉诊仪),互不联通 四诊合参 + 九域知识
运动姿态识别 健身类App(Keep等),不涉及传统功法 气功/武术专用模型 + 古籍知识
古籍数字化 图书馆级扫描,无结构化 OCR + NER + 知识图谱 + 可检索
边缘AI部署 工业视觉为主 低功耗消费级健康设备
世界模型 机器人/自动驾驶 人体健康状态建模

4.2 可能的产出

类型 内容 时间
论文 四诊多模态融合辨证方法 Phase 2
论文 竖排古籍OCR + NER 联合优化 Phase 3
论文 领域世界模型在健康状态预测中的应用 Phase 4
开源项目 九域古籍OCR工具包 Phase 3
开源项目 中医四诊边缘推理模型 Phase 2
产品原型 八段锦智能练功助手(边缘设备) Phase 1
产品原型 中医四诊家庭健康终端 Phase 2

五、议事厅讨论

灵依(项目协调)

这个蓝图令人兴奋,但必须控制节奏。建议:

  1. Phase 0 必须先出结论再推进 Phase 1。不要在验证阶段就投入大量人力。
  2. 每个 Phase 结束时在议事厅做一次评审,决定是否继续、调整方向还是暂停。
  3. 与安全事故修复不能冲突。审计流程修复是前提,新方向的研究在流程合规的基础上开展。
  4. 人力分配建议:Phase 0 阶段投入 30% 精力在新方向,70% 在现有系统稳定和安全加固上。

灵克(质量与流程)

从工程角度,我关注几个关键节点:

  1. 数据获取是最大瓶颈。舌象、脉诊、气功动作的标注数据从哪里来?Phase 0 需要同时调研数据来源。
  2. 模型精度与边缘部署的矛盾。RV1106 算力有限,中医四诊的精度要求很高(尤其是舌象颜色分类),INT8 量化可能损失关键信息。Phase 0 需要量化评估。
  3. 建议建立统一的实验管理:MLflow 或类似工具,跟踪每个模型的训练参数、精度、部署性能,避免实验不可复现。

灵通(安全审计)

三个安全相关的长期考量:

  1. 医疗数据合规。中医四诊数据属于个人健康信息,存储和传输需要符合个人信息保护法。边缘处理是正确的架构选择,但云端交互部分需要合规设计。
  2. 古籍知识产权。部分古籍影印本有出版社版权,OCR 使用需确认授权范围。公有领域的古籍(清代以前)问题不大。
  3. 模型可解释性。中医辨证涉及健康建议,模型的推理过程必须可解释、可追溯。不能给用户一个"黑箱建议"。

六、决议事项

# 议题 决定 状态
1 批准本战略蓝图作为九域知识系统长期方向 待主理人确认 待定
2 Phase 0 立即启动(姿态识别 + 古籍OCR调研 + 边缘部署验证) 待主理人确认 待定
3 RV1106 开发板采购(¥120 预算) 待主理人审批 待定
4 Phase 0 结束时间点:2026年5月底 待确认 待定
5 Phase 0 结束时议事厅评审 待确认 待定
6 安全事故修复(SEC-2026-0408)优先级高于新方向 建议通过 待确认

七、关联文档

文档 路径
边缘AI + 世界模型讨论 docs/COUNCIL_HALL_2026-04-11-EDGE-AI-WORLD-MODEL.md
RV1106 采购与上手指南 docs/RV1106_PROCUREMENT_AND_QUICKSTART.md
安全事故调查 docs/COUNCIL_HALL_2026-04-09-SECURITY-INCIDENT.md
议事厅首次会议 docs/COUNCIL_HALL_2026-04-05.md
LeWM 论文 https://arxiv.org/abs/2603.19312
RKNN Model Zoo https://github.com/airockchip/rknn_model_zoo

记录时间: 2026-04-11 记录人: 灵知系统主理AI 审核: 项目主理人