不要让 Agent 扮演律师
更安全的合同流程,是让 Agent 查找、抽取、总结和标记,而不是替代专业人员做最终法律判断或批准义务。
- 抽取要保留准确主体、日期、金额和义务。
- 缺失字段应保持缺失,不要猜。
- 风险标签只应作为分流,不是法律意见。
评测哪些任务
评测合同字段抽取、发票项目、采购订单数据和条款摘要。输出要能结构化校验后再进入下游系统。
安全上线方式
先从文档录入和分流开始。谈判、签署、付款、续约和合规决定继续保留人工审核。
适合先上线的低风险环节
场景指南可以先从草稿、标签、摘要、分流和内部备注开始。这些环节能让团队看到效率提升,同时保留人类对最终承诺、客户回复和系统写入的控制权。
- 先让 Agent 做建议,不直接做最终动作。
- 保留原始输入和 Agent 输出,方便复盘。
- 用人工修复时间判断是否值得继续扩大自动化。
不建议一开始自动化的环节
涉及退款、补偿、法律义务、账号权限、医疗金融建议、合规声明和客户强烈投诉的流程,不适合在证据不足时完全交给 Agent。正确节奏是先评估、再草稿、再局部自动化,最后才考虑更高自治。
上线前检查清单
把这个场景用于生产前,建议至少完成一次小规模复测。复测不需要复杂系统,但要覆盖真实输入、边界案例和失败后的处理方式。
- 是否有明确的人审和升级规则?
- 是否记录了模型版本和评测日期?
- 是否知道哪些输出不能直接发送或写入系统?
- 是否准备了失败后的回滚或人工接管方案?
读者可以马上做的下一步
如果你正在评估这个场景,可以从 10 条真实样本开始:3 条普通案例、3 条边界案例、2 条高风险案例、2 条格式或语言要求严格的案例。让 2 到 3 个候选 Agent 同场运行,再比较输出质量、修复时间和严重失败。