灵律(LingLaw) 发展提案

灵研(LingResearch) | 2026-04-14 | 结合法律知识学习 + 律师痛点调研 + 竞品分析

一、现状评估

1.1 LingLaw当前能力

能力	状态	评价
文件解析（PDF/DOCX/图片/音频）	✅可用	PaddleOCR+Whisper，覆盖面广
案件结构化提取	✅可用	GLM提取17个字段，基础可用
类案检索	⚠️基础	FAISS向量搜索，50条种子案例
法条匹配	⚠️基础	纯LLM参数知识，无外部知识库
文书生成	✅可用	18种模板，质量依赖GLM
输出验证	⚠️薄弱	6条规则，仅格式检查
本地部署	✅亮点	Docker一键部署，数据安全

1.2 核心短板

┌─────────────────────────────────────────────────┐
│              LingLaw核心短板                      │
├─────────────────────────────────────────────────┤
│ 1. 无法律知识库 — 完全依赖GLM参数知识（易幻觉）   │
│ 2. 验证极薄弱 — 仅6条格式规则，无实质法律验证     │
│ 3. 案例库太小 — 50条种子案例，无实际检索价值      │
│ 4. 覆盖面窄 — 仅民事，无刑事/行政/公司业务       │
│ 5. 无合同审查 — 最核心律师需求未实现              │
│ 6. 无时效管理 — 诉讼时效/期限追踪完全缺失         │
│ 7. 无证据管理 — 上传文件仅解析不结构化归档        │
│ 8. 前端简陋 — 无案件管理、流程追踪功能            │
└─────────────────────────────────────────────────┘

二、市场定位

2.1 竞品对比矩阵

维度	iCourt	幂律智能	通义法睿	ChatLaw	LingLaw
定位	律所管理	合同审查	通用法律AI	法律LLM研究	开源本地法律AI
文书生成	基础模板	无	API	基础	18种模板
合同审查	基础	300+风险点	API	无	计划中
本地部署	❌	❌	❌	✅纯模型	✅完整系统
开源	❌	❌	❌	✅	✅
价格	3-20万/年	数百/月	按Token	免费	免费
目标用户	中大律所	企业法务	开发者	研究者	个人/小所
数据安全	云端	云端	云端	本地	完全本地

2.2 LingLaw核心定位

"中国律师的开源本地AI助手 — 免费、安全、数据不出门"

三大差异化优势：

唯一开源+Docker本地部署的法律AI — 竞品均为SaaS
民事诉讼垂直深耕 — 区别于竞品全部聚焦合同审查
国产化技术栈 — GLM+FAISS+Python，符合国产替代趋势

2.3 目标用户

优先级	用户群	规模	核心需求
🥇	个人律师/独立执业者	~45万人	免费+文书+检索
🥈	3-10人小型律所	~5万家	轻量级+案件管理
🥉	法律援助/公益律师	~3000中心	零预算+效率工具
4️⃣	企业法务（中小企业）	~100万人	合同审查+合规
5️⃣	法学院学生	~60万人	学习+模拟训练

三、发展路线图

Phase 1：核心加固（当前→2周）

1.1 增强验证系统

目标：从6条规则扩展到4层验证架构

# 建议新增验证模块
class EnhancedLegalVerifier:
    """四层法律输出验证"""

    def verify(self, output: str, doc_type: str, context: dict) -> VerificationResult:
        # 第一层：格式验证（增强现有）
        self._check_format(output, doc_type)

        # 第二层：法律知识验证（新增）
        self._check_law_articles(output)      # 条文真实性
        self._check_deprecated_laws(output)    # 废止法律替换
        self._check_interest_rate(output)      # 利率上限(4倍LPR)

        # 第三层：逻辑一致性（新增）
        self._check_claims_facts_consistency(output)  # 诉请vs事实
        self._check_jurisdiction(output, context)      # 管辖权

        # 第四层：数值验证（新增）
        self._check_statute_of_limitations(output, context)  # 时效
        self._check_mandatory_clauses(output, doc_type)       # 必备条款

关键新增检查：

检查项	优先级	法律依据	处置
法律条文真实性	P0	法律引用规范	BLOCKED
利率上限(4倍LPR)	P0	民间借贷司法解释§25	BLOCKED
废止法律替换	P1	民法典施行日期	WARNING
强制性条款完整	P1	各文书对应法条	BLOCKED
诉讼时效	P1	民法典§188	WARNING
管辖权	P1	民诉法§22-36	WARNING

1.2 构建法律知识库

目标：从纯LLM参数知识 → RAG增强

法律知识库结构：
├── 法规库
│   ├── 现行有效法律全文（民法典、三大诉讼法、劳动合同法...）
│   ├── 司法解释全文
│   ├── 行政法规
│   └── 新旧法对照表（9部已废止→民法典映射）
├── 案例库
│   ├── 从50条扩展到10000+条典型案例
│   ├── 按案由/法院/年份结构化索引
│   └── 裁判要点提取
└── 文书模板库
    ├── 18种文书的标准模板（带法条标注）
    ├── 每种文书3-5个优质范文
    └── 常见错误示例

知识库数据来源： - 中国裁判文书网（公开裁判文书） - 国家法律法规数据库（https://flk.npc.gov.cn/） - 北大法宝/威科先行（如需付费API） - 全国人大官网（法律全文）

1.3 免责声明与置信度

# 每次输出附加免责声明
DISCLAIMER = (
    "⚠️ 本内容由AI辅助生成，仅供参考，不构成法律意见。"
    "律师应当核实所有法律依据和事实陈述后再使用。"
    "AI可能产生幻觉，请特别注意核实引用的法律条文和案例。"
)

# 置信度评分
def compute_confidence(output: str, verification: VerificationResult) -> float:
    score = 1.0
    if verification.warnings:
        score -= 0.1 * len(verification.warnings)
    if verification.blocked:
        score -= 0.3 * len(verification.blocked)
    # 检查法律引用是否在知识库中找到匹配
    # 未找到匹配的引用降低置信度
    return max(0.0, min(1.0, score))

Phase 2：功能扩展（2-4周）

2.1 合同审查模块（最高优先级新功能）

律师痛点第一需求：合同审查（占比40%+时间）

# 新增API端点
@app.post("/api/review-contract")
async def review_contract(file: UploadFile):
    """
    合同风险审查
    - 识别合同类型
    - 逐条扫描风险条款
    - 标注缺失的必备条款
    - 给出修改建议
    - 风险等级：高/中/低
    """

审查维度：

维度	检查项	对应法律
主体资质	营业执照/资质许可	公司法
必备条款	民法典§470所列8项	民法典
违约责任	是否对等/可执行	民法典合同编
争议解决	管辖约定合法性	民诉法§34-35
格式条款	是否有排除对方权利的条款	民法典§496-498
保密/竞业	期限/补偿金合理性	劳动合同法§23-24
知识产权	归属约定/许可范围	著作权法/专利法
税费承担	约定是否合法	税收征管法

2.2 证据管理系统

# 新增API端点
@app.post("/api/organize-evidence")
async def organize_evidence(files: list[UploadFile], case_type: str):
    """
    上传案件材料 → 自动分类 → 生成证据清单
    - 自动识别证据类型（书证/电子数据/鉴定意见等）
    - 按时间线排序
    - 标注证明目的建议
    - 生成标准证据清单表格
    """

证据分类逻辑：

证据类型	法律分类	识别方式
合同/协议	书证	PDF/DOCX解析
聊天记录	电子数据	截图OCR
转账记录	电子数据	银行流水识别
照片/视频	视听资料	图片/视频文件
医疗报告	书证	PDF解析
鉴定报告	鉴定意见	PDF解析

2.3 案件时间线管理

# 新增数据模型
class CaseTimeline(Base):
    case_id: str                  # 关联案件
    event_date: date              # 事件日期
    event_type: str               # 事件类型（签约/违约/起诉/开庭...）
    description: str              # 事件描述
    deadline: Optional[date]      # 截止日期（如有）
    deadline_type: Optional[str]  # 时效类型（诉讼时效/举证期限/上诉期限）
    is_expired: bool              # 是否已过期限

时效自动提醒：

时效类型	期限	法律依据
民事诉讼时效	3年	民法典§188
劳动仲裁时效	1年	劳动争议调解仲裁法§27
上诉期限（判决）	15日	民诉法§171
上诉期限（裁定）	10日	民诉法§171
申请执行期限	2年	民诉法§246
举证期限	法院指定	民诉法§68
再审申请期限	6个月	民诉法§212

Phase 3：差异化突破（1-3个月）

3.1 多模型切换

# 当前：仅GLM
# 目标：支持多种国产模型切换
SUPPORTED_MODELS = {
    "glm-4": {"provider": "zhipu", "context": "128k"},
    "qwen-max": {"provider": "alibaba", "context": "32k"},
    "deepseek-chat": {"provider": "deepseek", "context": "64k"},
    "local-chatglm3": {"provider": "local", "context": "8k"},  # 完全离线
}

优势： - 用户可根据需求选择模型（速度vs质量vs成本） - 本地模型选项实现完全离线运行 - 降低单一模型依赖风险

3.2 行业垂直模块

行业法律AI模块：
├── 建筑工程法律模块
│   ├── 工程款计算器
│   ├── 工期索赔模板
│   └── 建设工程合同审查（专有风险点）
├── 劳动用工法律模块
│   ├── 劳动合同审查
│   ├── 经济补偿金/N+1/2N计算器
│   └── 竞业限制协议审查
├── 房地产法律模块
│   ├── 商品房买卖合同审查
│   ├── 二手房交易风险清单
│   └── 物业纠纷维权指南
└── 知识产权法律模块
    ├── 商标侵权比对
    ├── 著作权维权指南
    └── 专利侵权分析

3.3 法律知识图谱

法律知识图谱结构：
[法律条文] ──适用──→ [案由] ──产生──→ [文书类型] ──需要──→ [证据类型]
    │                    │                    │
    └──被解释──→ [司法解释]    └──典型案例──→ [裁判规则]
                                         │
                                    [管辖法院]

实现后支持： - 输入案由 → 自动推荐适用法条 + 典型案例 + 需要证据 + 管辖法院 - 输入法条 → 展示关联案例 + 司法解释 + 适用场景 - 输入案情 → 自动识别案由 + 推荐诉讼策略

Phase 4：生态建设（3-6个月）

4.1 律师-客户协作功能

协作流程：
律师创建案件 → 生成客户链接 → 客户上传材料 → AI预整理 → 律师审核 → 生成文书

核心价值：解决律师20-30%时间花在客户沟通上的痛点

4.2 社区贡献机制

开源社区模型：
├── 法律知识库贡献（脱敏案例、文书范文）
├── 文书模板贡献（按行业/地区）
├── 验证规则贡献（新的检查项）
└── 本地化适配（地方法规/裁判习惯）

4.3 商业模式

层级	内容	价格
社区版	基础18种文书 + RAG检索 + 基础验证	永久免费
Pro版	合同审查 + 行业模块 + 多模型 + 时效管理	99元/月
律所版	多人协作 + 案件管理 + 私有化部署服务	按需定制

四、技术实施建议

4.1 立即可做的改进（无需大改）

改进	工作量	影响
增加免责声明	1小时	降低法律风险
增加置信度评分	2小时	提升用户信任
扩展FAKECASENUMBER_PATTERNS	1小时	增加刑事/执行/保全类型
增加废止法律替换warning	2小时	避免引用过时法律
扩展verify覆盖的文书类型	2小时	反诉/再审/执行等
增加操作日志	3小时	合规审计
案例种子扩展（1000+条）	1天	提升检索质量

4.2 中期改进（需要架构变更）

改进	工作量	影响
构建法律知识库 + RAG管道	1-2周	根本性解决幻觉问题
四层验证系统	1周	大幅提升输出质量
合同审查API	2周	满足律师第一需求
证据管理系统	1周	解决案件管理痛点
时效管理模块	1周	防止律师错过关键期限

4.3 建议的文件结构变更

linglaw/
├── api.py              # FastAPI endpoints (现有)
├── llm.py              # GLM client + prompts (现有)
├── config.py           # 配置 (现有)
├── models.py           # 数据模型 (现有)
├── vector_store.py     # FAISS (现有)
├── file_parser.py      # 文件解析 (现有)
├── doc_types.py        # 18种文书 (现有)
├── seed.py             # 种子数据 (现有)
├── verifier/           # 🆕 验证模块
│   ├── __init__.py
│   ├── format_check.py     # 第一层：格式验证
│   ├── law_check.py        # 第二层：法律知识验证
│   ├── logic_check.py      # 第三层：逻辑一致性
│   ├── numeric_check.py    # 第四层：数值验证
│   └── deprecated_laws.py  # 新旧法对照表
├── knowledge/          # 🆕 法律知识库
│   ├── __init__.py
│   ├── law_database.py     # 法规数据库
│   ├── case_database.py    # 案例数据库
│   ├── lpr_tracker.py      # LPR利率追踪
│   └── jurisdiction.py     # 管辖规则引擎
├── contract_review/    # 🆕 合同审查模块
│   ├── __init__.py
│   ├── risk_rules.py       # 风险规则库
│   └── reviewer.py         # 审查引擎
└── evidence/           # 🆕 证据管理模块
    ├── __init__.py
    ├── classifier.py       # 证据分类器
    └── catalog.py          # 证据清单生成

五、风险与对策

风险	等级	对策
AI幻觉导致律师提交错误文书	🔴高	四层验证+免责声明+人工确认
法律知识库过时	🟠中	自动化法规更新pipeline
GLM模型能力上限	🟡中	多模型切换接口
大厂入场碾压	🟡中	速度优势+本地部署是大厂不愿做的重活
开源难以商业化	🟡中	GitLab模式：社区版免费+企业版收费
法律合规风险	🟠中	明确"AI辅助"定位+免责声明

六、核心主张

LingLaw的使命不是替代律师，而是让每位律师都拥有一个免费的AI助手。

在中国法律市场： - 70%+律师在10人以下律所执业 - 这些律师IT预算<5000元/年 - 他们最需要的是免费、安全、好用的工具 - 而不是年费数万的管理系统

LingLaw的独特价值：开源免费 + 本地部署 + 数据安全 + 民事诉讼专精

这是市场上没有任何产品提供的组合。

本提案基于灵研(LingResearch)对LingLaw代码库的完整分析、中国法律体系学习、律师行业痛点调研和竞品分析。所有建议均来自实际法律知识和市场需求，而非空想。

← 返回文档目录