ShiZhi: A Chinese Lightweight Large Language Model for Court View Generation

这篇文章聚焦法律AI领域,提出了首个专为刑事法庭意见生成设计的中文轻量级大模型ShiZhi,并构建了高质量数据集CCVG,有效提升了法庭意见生成与罪名预测性能。

一、文章主要内容总结

  1. 研究背景与任务:刑事法庭意见生成(CVG)是法律AI的核心任务,需基于案件事实自动生成判决书中的“法庭意见”部分。该任务因案件事实复杂多样,直接生成难度较高,且此前缺乏专门针对该任务的大模型。
  2. 核心工作
    • 数据集构建:创建中文法庭意见生成数据集CCVG,包含超11万条案件数据,每条数据均配对“案件事实”与“法庭意见”,并通过多步过滤(如基于关键词提取章节、罪名提取、长度筛选)保证数据质量。
    • 模型开发:以Qwen2-0.5B-Instruct为基础模型,在CCVG上进行微调,开发出0.5B参数的轻量级模型ShiZhi,采用法官角色设定的提示词模板,适配CVG任务。
    • 实验结果:ShiZhi在法庭意见生成任务上BLEU-1达58.5,罪名预测任务准确率86.1%、宏F1值92.5%,显著优于基础模型,证明高质量领域数据微调能让轻量级模型具备优秀的法律文本生成与推理能力。
  3. 局限性:模型与数据集仅支持中文,无法适配其他语言与法律体系;数据集案件截止到2021年,未涵盖最新法律动态;仅探索0.5B参数模型,未验证不同模型规模的影响。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值