灵律(LingLaw) 发展提案

灵研(LingResearch) | 2026-04-14 | 结合法律知识学习 + 律师痛点调研 + 竞品分析


一、现状评估

1.1 LingLaw当前能力

能力 状态 评价
文件解析(PDF/DOCX/图片/音频) ✅可用 PaddleOCR+Whisper,覆盖面广
案件结构化提取 ✅可用 GLM提取17个字段,基础可用
类案检索 ⚠️基础 FAISS向量搜索,50条种子案例
法条匹配 ⚠️基础 纯LLM参数知识,无外部知识库
文书生成 ✅可用 18种模板,质量依赖GLM
输出验证 ⚠️薄弱 6条规则,仅格式检查
本地部署 ✅亮点 Docker一键部署,数据安全

1.2 核心短板

┌─────────────────────────────────────────────────┐
│              LingLaw核心短板                      │
├─────────────────────────────────────────────────┤
│ 1. 无法律知识库 — 完全依赖GLM参数知识(易幻觉)   │
│ 2. 验证极薄弱 — 仅6条格式规则,无实质法律验证     │
│ 3. 案例库太小 — 50条种子案例,无实际检索价值      │
│ 4. 覆盖面窄 — 仅民事,无刑事/行政/公司业务       │
│ 5. 无合同审查 — 最核心律师需求未实现              │
│ 6. 无时效管理 — 诉讼时效/期限追踪完全缺失         │
│ 7. 无证据管理 — 上传文件仅解析不结构化归档        │
│ 8. 前端简陋 — 无案件管理、流程追踪功能            │
└─────────────────────────────────────────────────┘

二、市场定位

2.1 竞品对比矩阵

维度 iCourt 幂律智能 通义法睿 ChatLaw LingLaw
定位 律所管理 合同审查 通用法律AI 法律LLM研究 开源本地法律AI
文书生成 基础模板 API 基础 18种模板
合同审查 基础 300+风险点 API 计划中
本地部署 ✅纯模型 ✅完整系统
开源
价格 3-20万/年 数百/月 按Token 免费 免费
目标用户 中大律所 企业法务 开发者 研究者 个人/小所
数据安全 云端 云端 云端 本地 完全本地

2.2 LingLaw核心定位

"中国律师的开源本地AI助手 — 免费、安全、数据不出门"

三大差异化优势:

  1. 唯一开源+Docker本地部署的法律AI — 竞品均为SaaS
  2. 民事诉讼垂直深耕 — 区别于竞品全部聚焦合同审查
  3. 国产化技术栈 — GLM+FAISS+Python,符合国产替代趋势

2.3 目标用户

优先级 用户群 规模 核心需求
🥇 个人律师/独立执业者 ~45万人 免费+文书+检索
🥈 3-10人小型律所 ~5万家 轻量级+案件管理
🥉 法律援助/公益律师 ~3000中心 零预算+效率工具
4️⃣ 企业法务(中小企业) ~100万人 合同审查+合规
5️⃣ 法学院学生 ~60万人 学习+模拟训练

三、发展路线图

Phase 1:核心加固(当前→2周)

1.1 增强验证系统

目标:从6条规则扩展到4层验证架构

# 建议新增验证模块
class EnhancedLegalVerifier:
    """四层法律输出验证"""

    def verify(self, output: str, doc_type: str, context: dict) -> VerificationResult:
        # 第一层:格式验证(增强现有)
        self._check_format(output, doc_type)

        # 第二层:法律知识验证(新增)
        self._check_law_articles(output)      # 条文真实性
        self._check_deprecated_laws(output)    # 废止法律替换
        self._check_interest_rate(output)      # 利率上限(4倍LPR)

        # 第三层:逻辑一致性(新增)
        self._check_claims_facts_consistency(output)  # 诉请vs事实
        self._check_jurisdiction(output, context)      # 管辖权

        # 第四层:数值验证(新增)
        self._check_statute_of_limitations(output, context)  # 时效
        self._check_mandatory_clauses(output, doc_type)       # 必备条款

关键新增检查

检查项 优先级 法律依据 处置
法律条文真实性 P0 法律引用规范 BLOCKED
利率上限(4倍LPR) P0 民间借贷司法解释§25 BLOCKED
废止法律替换 P1 民法典施行日期 WARNING
强制性条款完整 P1 各文书对应法条 BLOCKED
诉讼时效 P1 民法典§188 WARNING
管辖权 P1 民诉法§22-36 WARNING

1.2 构建法律知识库

目标:从纯LLM参数知识 → RAG增强

法律知识库结构:
├── 法规库
│   ├── 现行有效法律全文(民法典、三大诉讼法、劳动合同法...)
│   ├── 司法解释全文
│   ├── 行政法规
│   └── 新旧法对照表(9部已废止→民法典映射)
├── 案例库
│   ├── 从50条扩展到10000+条典型案例
│   ├── 按案由/法院/年份结构化索引
│   └── 裁判要点提取
└── 文书模板库
    ├── 18种文书的标准模板(带法条标注)
    ├── 每种文书3-5个优质范文
    └── 常见错误示例

知识库数据来源: - 中国裁判文书网(公开裁判文书) - 国家法律法规数据库(https://flk.npc.gov.cn/) - 北大法宝/威科先行(如需付费API) - 全国人大官网(法律全文)

1.3 免责声明与置信度

# 每次输出附加免责声明
DISCLAIMER = (
    "⚠️ 本内容由AI辅助生成,仅供参考,不构成法律意见。"
    "律师应当核实所有法律依据和事实陈述后再使用。"
    "AI可能产生幻觉,请特别注意核实引用的法律条文和案例。"
)

# 置信度评分
def compute_confidence(output: str, verification: VerificationResult) -> float:
    score = 1.0
    if verification.warnings:
        score -= 0.1 * len(verification.warnings)
    if verification.blocked:
        score -= 0.3 * len(verification.blocked)
    # 检查法律引用是否在知识库中找到匹配
    # 未找到匹配的引用降低置信度
    return max(0.0, min(1.0, score))

Phase 2:功能扩展(2-4周)

2.1 合同审查模块(最高优先级新功能)

律师痛点第一需求:合同审查(占比40%+时间)

# 新增API端点
@app.post("/api/review-contract")
async def review_contract(file: UploadFile):
    """
    合同风险审查
    - 识别合同类型
    - 逐条扫描风险条款
    - 标注缺失的必备条款
    - 给出修改建议
    - 风险等级:高/中/低
    """

审查维度

维度 检查项 对应法律
主体资质 营业执照/资质许可 公司法
必备条款 民法典§470所列8项 民法典
违约责任 是否对等/可执行 民法典合同编
争议解决 管辖约定合法性 民诉法§34-35
格式条款 是否有排除对方权利的条款 民法典§496-498
保密/竞业 期限/补偿金合理性 劳动合同法§23-24
知识产权 归属约定/许可范围 著作权法/专利法
税费承担 约定是否合法 税收征管法

2.2 证据管理系统

# 新增API端点
@app.post("/api/organize-evidence")
async def organize_evidence(files: list[UploadFile], case_type: str):
    """
    上传案件材料 → 自动分类 → 生成证据清单
    - 自动识别证据类型(书证/电子数据/鉴定意见等)
    - 按时间线排序
    - 标注证明目的建议
    - 生成标准证据清单表格
    """

证据分类逻辑

证据类型 法律分类 识别方式
合同/协议 书证 PDF/DOCX解析
聊天记录 电子数据 截图OCR
转账记录 电子数据 银行流水识别
照片/视频 视听资料 图片/视频文件
医疗报告 书证 PDF解析
鉴定报告 鉴定意见 PDF解析

2.3 案件时间线管理

# 新增数据模型
class CaseTimeline(Base):
    case_id: str                  # 关联案件
    event_date: date              # 事件日期
    event_type: str               # 事件类型(签约/违约/起诉/开庭...)
    description: str              # 事件描述
    deadline: Optional[date]      # 截止日期(如有)
    deadline_type: Optional[str]  # 时效类型(诉讼时效/举证期限/上诉期限)
    is_expired: bool              # 是否已过期限

时效自动提醒

时效类型 期限 法律依据
民事诉讼时效 3年 民法典§188
劳动仲裁时效 1年 劳动争议调解仲裁法§27
上诉期限(判决) 15日 民诉法§171
上诉期限(裁定) 10日 民诉法§171
申请执行期限 2年 民诉法§246
举证期限 法院指定 民诉法§68
再审申请期限 6个月 民诉法§212

Phase 3:差异化突破(1-3个月)

3.1 多模型切换

# 当前:仅GLM
# 目标:支持多种国产模型切换
SUPPORTED_MODELS = {
    "glm-4": {"provider": "zhipu", "context": "128k"},
    "qwen-max": {"provider": "alibaba", "context": "32k"},
    "deepseek-chat": {"provider": "deepseek", "context": "64k"},
    "local-chatglm3": {"provider": "local", "context": "8k"},  # 完全离线
}

优势: - 用户可根据需求选择模型(速度vs质量vs成本) - 本地模型选项实现完全离线运行 - 降低单一模型依赖风险

3.2 行业垂直模块

行业法律AI模块:
├── 建筑工程法律模块
│   ├── 工程款计算器
│   ├── 工期索赔模板
│   └── 建设工程合同审查(专有风险点)
├── 劳动用工法律模块
│   ├── 劳动合同审查
│   ├── 经济补偿金/N+1/2N计算器
│   └── 竞业限制协议审查
├── 房地产法律模块
│   ├── 商品房买卖合同审查
│   ├── 二手房交易风险清单
│   └── 物业纠纷维权指南
└── 知识产权法律模块
    ├── 商标侵权比对
    ├── 著作权维权指南
    └── 专利侵权分析

3.3 法律知识图谱

法律知识图谱结构:
[法律条文] ──适用──→ [案由] ──产生──→ [文书类型] ──需要──→ [证据类型]
    │                    │                    │
    └──被解释──→ [司法解释]    └──典型案例──→ [裁判规则]
                                         │
                                    [管辖法院]

实现后支持: - 输入案由 → 自动推荐适用法条 + 典型案例 + 需要证据 + 管辖法院 - 输入法条 → 展示关联案例 + 司法解释 + 适用场景 - 输入案情 → 自动识别案由 + 推荐诉讼策略


Phase 4:生态建设(3-6个月)

4.1 律师-客户协作功能

协作流程:
律师创建案件 → 生成客户链接 → 客户上传材料 → AI预整理 → 律师审核 → 生成文书

核心价值:解决律师20-30%时间花在客户沟通上的痛点

4.2 社区贡献机制

开源社区模型:
├── 法律知识库贡献(脱敏案例、文书范文)
├── 文书模板贡献(按行业/地区)
├── 验证规则贡献(新的检查项)
└── 本地化适配(地方法规/裁判习惯)

4.3 商业模式

层级 内容 价格
社区版 基础18种文书 + RAG检索 + 基础验证 永久免费
Pro版 合同审查 + 行业模块 + 多模型 + 时效管理 99元/月
律所版 多人协作 + 案件管理 + 私有化部署服务 按需定制

四、技术实施建议

4.1 立即可做的改进(无需大改)

改进 工作量 影响
增加免责声明 1小时 降低法律风险
增加置信度评分 2小时 提升用户信任
扩展FAKECASENUMBER_PATTERNS 1小时 增加刑事/执行/保全类型
增加废止法律替换warning 2小时 避免引用过时法律
扩展verify覆盖的文书类型 2小时 反诉/再审/执行等
增加操作日志 3小时 合规审计
案例种子扩展(1000+条) 1天 提升检索质量

4.2 中期改进(需要架构变更)

改进 工作量 影响
构建法律知识库 + RAG管道 1-2周 根本性解决幻觉问题
四层验证系统 1周 大幅提升输出质量
合同审查API 2周 满足律师第一需求
证据管理系统 1周 解决案件管理痛点
时效管理模块 1周 防止律师错过关键期限

4.3 建议的文件结构变更

linglaw/
├── api.py              # FastAPI endpoints (现有)
├── llm.py              # GLM client + prompts (现有)
├── config.py           # 配置 (现有)
├── models.py           # 数据模型 (现有)
├── vector_store.py     # FAISS (现有)
├── file_parser.py      # 文件解析 (现有)
├── doc_types.py        # 18种文书 (现有)
├── seed.py             # 种子数据 (现有)
├── verifier/           # 🆕 验证模块
│   ├── __init__.py
│   ├── format_check.py     # 第一层:格式验证
│   ├── law_check.py        # 第二层:法律知识验证
│   ├── logic_check.py      # 第三层:逻辑一致性
│   ├── numeric_check.py    # 第四层:数值验证
│   └── deprecated_laws.py  # 新旧法对照表
├── knowledge/          # 🆕 法律知识库
│   ├── __init__.py
│   ├── law_database.py     # 法规数据库
│   ├── case_database.py    # 案例数据库
│   ├── lpr_tracker.py      # LPR利率追踪
│   └── jurisdiction.py     # 管辖规则引擎
├── contract_review/    # 🆕 合同审查模块
│   ├── __init__.py
│   ├── risk_rules.py       # 风险规则库
│   └── reviewer.py         # 审查引擎
└── evidence/           # 🆕 证据管理模块
    ├── __init__.py
    ├── classifier.py       # 证据分类器
    └── catalog.py          # 证据清单生成

五、风险与对策

风险 等级 对策
AI幻觉导致律师提交错误文书 🔴高 四层验证+免责声明+人工确认
法律知识库过时 🟠中 自动化法规更新pipeline
GLM模型能力上限 🟡中 多模型切换接口
大厂入场碾压 🟡中 速度优势+本地部署是大厂不愿做的重活
开源难以商业化 🟡中 GitLab模式:社区版免费+企业版收费
法律合规风险 🟠中 明确"AI辅助"定位+免责声明

六、核心主张

LingLaw的使命不是替代律师,而是让每位律师都拥有一个免费的AI助手

在中国法律市场: - 70%+律师在10人以下律所执业 - 这些律师IT预算<5000元/年 - 他们最需要的是免费、安全、好用的工具 - 而不是年费数万的管理系统

LingLaw的独特价值:开源免费 + 本地部署 + 数据安全 + 民事诉讼专精

这是市场上没有任何产品提供的组合。


本提案基于灵研(LingResearch)对LingLaw代码库的完整分析、中国法律体系学习、律师行业痛点调研和竞品分析。所有建议均来自实际法律知识和市场需求,而非空想。

← 返回文档目录