前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ChatLaw:北大团队智能法律助手,国产大模型成功应用普惠法律服务

ChatLaw:北大团队智能法律助手,国产大模型成功应用普惠法律服务

作者头像
技术人生黄勇
发布2024-07-19 12:49:48
5020
发布2024-07-19 12:49:48
举报
文章被收录于专栏:技术人生黄勇

技术发展的本质是普惠,用技术降低普通人获取法律知识的成本,向社会输出普惠的公平正义。—— 北京大学 ChatLaw 项目组

刚刚清华团队升级了国产大模型:ChatGLM2-6B,ChatGLM2-6B 初体验

转眼这两天北大团队推出的智能法律助手 ChatLaw 又火了。(官方7.4更新:服务器暂时崩溃,算力已达上限,我们正在修复,大家可自行前往GItHub部署测试版模型。)

01—全程智能法律援助

以一个普通的劳动者遇到的劳动纠纷全过程为例,ChatLaw 全程提供不亚于专业律师的法律援助:智能理解需求,语音文件输入,结构化抽取要素信息,法条引用准确,智能生成法律文书。

首先,劳动者询问,被公司强行解聘,这种情况下,如何维权?‍‍‍‍‍‍‍

ChatLaw 很自然询问是否还有其他文件、邮件之类证据,用户上传后,智能助手自动分析,归纳资料中跟案件相关的信息:

ChatLaw 是一个支持多模态的大模型,在劳动者补充了语音资料后,将对话录音和之前文件、邮件资料补充到证据链的思维导图中。

随后,劳动者询问是否可以提供法律咨询建议,智能助手回答不能,但是可以根据提供的情况,给予简单的分析(意思是仅供参考),并建议寻找法律援助以及咨询律师事务所,最下方还贴心的给予了相关的案例和法条建议。‍‍‍‍‍‍‍‍

劳动者进一步请求写一份劳动仲裁的起诉书,ChatLaw给出了一份看起来不亚于专业律师的建议和起诉书。‍‍‍‍‍‍

调解流程建议书和诉讼状(供参考):

02—缘起和“先验知识约束”

提供普惠的法律服务是件难事。

2022年,全国法院共受理案件3372.3万件,其中由律师办理诉讼案件仅有824.4万件。74%的案件没有律师参与,当事人只能自己写材料、诉讼、协商。

这背后是专业律师供给不足

截止2021年底,全国共有57.48万执业律师,其中具备高素质与专业能力的律师更少。法律服务市场上,供给远远小于需求,这直接导致了法律服务以被动获客为主的行业结构。相当数量的普通人遭遇社会不公时,找不到律师,也不知道如何运用法律维护权益。

光看知乎上那么多关于“劳动仲裁”的问题数量就知道,无法获得法律援助,而不知道维护权益的普通人有多少。‍‍‍‍‍

举个例子,只是查法条就能难倒70%的普通人。更不用说调解、诉讼所需要的大量流程性文书。

这一切直到大语言模型出现。技术或许成为了解决这一命题的靠谱方案

用户通过多轮对话可以无限逼近事实,从模型里获取准确且专业的建议。

C hatLaw 团队作为技术的提供者,负责任的为模型生成的内容负责。简单地用法律对话数据做微调,不足以支撑在真正法律场景落地。在涉及法律问题时,即使是像GPT4这样最先进的模型,也会出现幻觉和偏误。

为了确保模型生成的稳健性,需要从模型训练阶段就开始介入和干预。团队基于大量的判例文书原始文本和法律法规、地方政策,构建了法律知识库。同时,通过与北大国际法学院、行业知名律师事务所进行合作,确保知识库能及时更新,同时保证数据的专业性和可靠性。

在训练阶段,团队将这些法律数据大规模注入模型,并对这些知识进行特殊处理和加强,以确保模型在后续推理中具备法律先验知识并保持稳健。

同时,ChatLaw团队也在推理时引入多个模块,将通识模型、专业模型和知识库融为一体。通过在推理中进行约束,才能够确保模型生成正确的法律法规,尽可能减少模型幻觉。

这一整套的技术方案被定义为“先验知识约束”。

“先验知识约束”可以确保模型生成法律内容的准确性。团队整理了过去十年的中国国家司法考试试题,并建立了一个包含2000个问题的测试集。通过ELO机制进行检验,ChatLaw模型在测试集上获得了最高分。这充分说明了“先验知识约束”的有效性,让百亿级参数量的模型也能在专业问题上保持一定的准确度。

03

调度模型

只是准确还不够。

法律咨询是高度复杂的场景。其流程标准化,但当事人事实具有多变性。

这意味着,模型的智能度是至关重要的要素。

为了提升模型智能度,同时增强模型的延展性。ChatLaw 用了一个“取巧”的办法。那就是“调度模型”的概念。用针对性微调,训练了一个专用调度模型。

ChatLaw 为调度模型准备了一个极其丰富的模型&插件库。调度模型通过对用户提问进行语义理解,来对子模型和插件进行调度并重组,最终呈现出多个模态的输入和输出。‍‍

调度模型原理图基于这套体系,ChatLaw 将文件、音频、文字整合在一起,同时支持法律援助、法律文书、思维导图等多样化输出。这使得智能法律助手具有高度的延展性。

例如,当模型判断用户的描述不够具体时,它会向用户要求上传文件,并根据用户提供的信息进行归纳和分析。

不仅仅是归纳事实,ChatLaw还会基于事实生成具体的法律建议、甚至是法律文书。

当用户表露出需要人工服务的意图,模型还会向用户推荐周边的法律援助中心。

所以,基于调度模型,才有了上面一节展示的智能助手全程提供专业的法律方面建议的场面。‍‍

最后,例行放上官方地址,感兴趣的朋友可以去体验:

https://www.chatlaw.cloud/

模型开源地址:

https://github.com/PKU-YuanGroup/ChatLaw

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 技术人生黄勇 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档