律师与AIGC工具：双向奔赴，才能互相成就丨威科先行

本期嘉宾

薛颖

某医学创新AIGC集团总法律顾问

*头像系AI生成

这些话不是科幻片台词，而是律师工作中越来越普遍的存在：

“这篇文档由AI生成，提醒律师做一下审核”
“让律师写个解读这个问题的prompts，方便AI做出协议底稿来，高年级律师再改一遍就行了”
“开发个应用，解决这一类长文本的高频生成需求，没这么多人工来做这些”……

与传统的律师工作中使用数据库检索、自动计时、合同在线审核等法律科技产品不同，“生成式AI”的科技与狠活儿已经是法律打工人的必修课，会用AI的律师与AIGC技术将是双向奔赴、互相成就。

笔者之于法律类AIGC应用有三重身份角色，自称“AI时代的斜杠青（中）年”：AI行业的法务/AI应用的用户/AI应用开发者。其中后两者有助于前者角色的履职，也让笔者有机会使用双重视角感受“律师与AI应用”的故事：双向奔赴，才能互相成就。

先上结论：

a) 法律AI助理指的是对通用大模型实施专门的、精细化的法律数据优化训练后的垂类AI应用。

b) 通用大模型泛化性强，难以满足法律专业内容生成需求，特别是在数千字长文本法律文件生成、综合性专业方案提供、深入具体场景的专业问答咨询等场景，通用大模型生成结果的可信度、准确性、精细度、稳定性、完整度等都距离律师的专业交付尚远，因此需要在通用大模型基础上做“垂类法律应用”。

c) 目前垂类法律AI应用普遍的样态是生成非重复性文本或问答的智能体，载体是新增功能、小程序、网站等。哪怕这些应用还在“四个轮子+发动机”的初始阶段，可能没有传统“马车”（专业律师人工）跑得快、跑得稳，维护成本也不低，但汽车会代替马车是客观趋势，所以，法律人会普遍用上AI应用是个趋势。

d) 当前阶段使用垂类大模型或法律AI应用后，越是低职级律师的交付物，即生成内容的专业深度不高、对底座大模型生成能力依赖强，则AI生成物的人工替代率（以同等律师的替代工时计，下同）越高，甚至能高达50-70%。

e) 当前阶段使用垂类大模型或法律AI应用后，越是高职级律师的交付物，即生成内容的专业深度强、对限定领域和场景的知识与经验需求强、要处理的法律问题更接近边界案例，则AI生成物的人工替代率越低，甚至只能到10-20%。

f) 越是能给定高质量知识库和提示词中的指令或要求越具体，则生成内容的限定性越强、文本越准确、律师对生成物的修改时间越少，相应地需要应用或律师在前端prompts投入的时间越多。

g) 做个简单的竞争优势与发展潜力排序：专业资深且会用AI应用的律师＞专业初级且会用AI应用的律师＞专业资深但不会用AI应用的律师＞专业初级且不会用AI应用的律师。

以下具体聊聊：

1. 通用大模型是基础设施，但也只是基础设施

最初，AI技术只应用于简单的法律检索、数据分类和分析，以极大地提高浏览和检索法律文件、进行项目管理等方面的效率；后来，以大语言模型为代表的通用大模型代表了人工智能技术发展的新阶段，生成式AI技术（AIGC）在法律领域内的应用范围扩大到更为智能的工作中，例如法律文件生成、法律文献解读、法律意见问答、诉讼结果预测等。

尽管人们普遍预期，生成式AI技术会大幅提升律师工作效率甚至替代很多法律人的岗位，但事实上，笔者的感受是，哪怕是公认为SOTA的通用大模型，如果直接应用在律师工作中，实际表现也经常“欠揍”，难免有鸡肋之感，与通用大模型泛化的表现完全不可同日而语，甚至律师用过就会对大模型“祛魅”。

可以想见，法律专业领域是一个容错率低、幻觉损害性大、专业认知门槛高、公开可用训练数据少的垂分领域，对AI生成物的准确性、稳定性、可溯源性、逻辑性都有极高要求，而通用大模型本身则开放性高，在处理法律这样特定领域的专业和复杂问题时往往限定不足，很容易生成不准确、不深入、不具体的法律意见/文件/表述等。

比如，LLM本身无法像人类律师那样理解各种法律条文或判例的微妙之处，也会错误地解释法律术语或归纳分析案件事实，更可能的是仅仅给出三五百字的“车轱辘”口水话。

再如，越是高价值的法律服务对细分领域的专业化和定制化需求越强，虽然AI大模型能够处理海量数据，但在检索到特定法律领域的深层知识和技术性细节、实时吸收法律法规和司法判例最新进展等方面，还明显存在局限。

个人感受是，如果不做专门的法律类应用开发或模型训练，则通用大模型在专业交付中可用之物甚少。毕竟通用大模型这个好学生擅长“开放性”生成，而法律专业则要求AI满足给定领域的极强限定性，通用大模型本身难以解决这个难题。

2. 法律垂类的AI应用是法律人的必然选择

为了充分挖掘AI模型在法律领域的潜力，降低其产生误导性信息的风险，并增强其提供答案的可信度，还是需要对通用大模型实施专门的、精细化的法律数据优化训练，包括对数据集进行细致的分类和筛选，持续学习最新的专业进展，或者以专业完善的提示词输入，让大模型深化对特定领域法律知识的理解，提升其专业化和定制化服务能力效能——这点和律师个人的成长其实同理。

因此，法律垂分领域的行业模型或专属应用非常重要，可以是法律行业通用的，也可以是一家律所或公司、一类业务场景、一个问题域专用的……以此替代通用大模型在法律场景上的短板。

因为这些行业模型或应用专注于特定法律领域或任务，能够深入理解法律领域的复杂性和专业性，不仅提高了法律服务的效率、质量、稳定性，还能降低律师工时成本（甚至可能颠覆“工时计费”模式），能够满足更多法律服务的需求，从而推动法律服务的获取更加公平和易得。

另外，目前通用大模型还无法完全解决AI与人类价值观的对齐，是“现有技术”的固有难题，但对于法律领域而言，确保AI能够与人类价值观对齐，比在任何其他领域都更为重要，在此意义上，开发专属于法律人的AI智能体，通过RAG技术或者微调来矫正通用大模型的认知偏差，有助于缓解AI对齐风险，是确保“科技向善”的必然路径。

以上体会的直白版就是：法律人想要有个好用的AI助理，还是得有专业的法律AI应用或模型，不要指望直接用通用大模型。

3. 法律服务降本增效：律师与AI助理的双向奔赴

上图是笔者团队开发的一个迷你AI应用的界面截图：隐私政策生成。

这一应用可以支持：一位没有数据合规经验的一年级律师用0.5-1小时即可生成一份9000字的隐私政策文本（不含交互页与增强提示等），且文本表述专业顺畅、结构完整严谨、不是抄袭拼凑，并且确保符合现行监管要求、国标和同行普遍实践。此后，只需要一位高年级律师花费0.5-1天时间进行全文审核，并结合业务尽调结果和产品测试结果（当然，这是另外计时的工作），进行文本补充和审核即可定稿。

因此，生成一份高质量隐私政策的整体律师工时（尤其是高年级律师工时）大大减少，同时还保证了稳定持平的交付质量。

上图是威科先行的劳动法智能问答对话。

实测可见，在“我国劳动法领域”这一限定范围内，上述AI问答应用生成质量专业性和准确性远超市场上通用大模型。推测这一应用大量读取和学习了我国劳动法领域的法律法规、案例和文献，数据质量高且量大。

但相应的，也会不时出现拒答，毕竟超出限定知识库内容的，哪怕也是用户认为可能与劳动法相关的，应该也会拒绝给出结论，好比一位诚实但有些僵化的好学生，我会的就考出高分；不会的就告诉你我没学过。

一般而言，律师在使用AI应用中的提示词内容会包括“角色” “背景”“任务”和“要求”，在基座模型能力、知识库相差不大的情况下，提示词中最为开放、对生成质量贡献因子最大、最能体现律师专业能力的是“要求”描述。

例如：你是一个资深数据合规律师，现在有一位XXX行业的客户需要上线一款XX端的应用、针对中国大陆市场，需要你来撰写一份隐私政策文件，这份文件的要求是要适用中国大陆关于个人信息保护的法律法规，参照XXX标准和XXX行业的通行做法，分为XX个部分、每一部分要分别描述的是XXX，参考范例是XX。

而经过了专业训练的AI垂类应用，对用户的专业任务的理解和描述就会越详细、对生成标准拆解越明确，则生成内容越专业、越稳定，好比专业水平过硬的师傅更有可能训练出好徒弟。

总的来说，好律师与好用的AI助理是相互成就——

如果律师本身的专业能力强，还会使用专业的法律AI助理，则在专业场景识别、知识沉淀、提示词优化、模型效果测试等方面都有律师专业能力的加持，实现与AI强强联合的plus效应。
如果律师本身的专业能力尚有待提升，但会使用高水平的垂分法律AI助理，获得通用大模型生成之上的生成能力，则可以快速学习和获取超越自身专业积累的生成物。
如果律师本身的专业能力强，但不会使用高水平的垂分模型，那就只能还是传统的低效率、高成本的运营方式。
如果律师本身的专业能力差，但会使用超越自身专业水平的法律AI助理，效率翻倍提升。

概言之，如果律师本身专业能力是1 ，垂分领域的AIGC工具应用是0，那么“1”和“0”的结合就很可能10倍、100倍提升律师服务效率和水平。

本文写作中由AI辅助。版权归属作者个人，文责由作者个人自负。

威科先行丨法务宝

为了满足法务群体自身职场进阶、发展需求，威科先行®·法律信息库特别推出法务宝产品，聚焦法务职场进阶与技能提升。法务宝产品期待能与您共建企业法律人同业交流、携手成长的良性生态圈。

申请试用

威科先行

法务宝

长按并识别左侧二维码

WHEN YOU HAVE TO BE RIGHT.

想了解更多关于「威科先行」的产品和信息

欢迎长按下方图片，添加「小威」为微信好友