前言
本期,我们从另一个法律应用场景来考察一下通用大模型和法律大模型的表现。
在实务中,法律人都“躲”不过的另一个重要的工作场景,就是:
“ 类案检索总结 ”
类案检索的终端需求,是完成一份类案检索报告。律师、法务等实务人士往往需要根据以一定检索目标为依据所收集到的类案信息,去合理预判待决案件可能的走向以及后续诉讼策略的敲定,而类案检索报告则是这些信息汇总的载体。
然而,从检索类案着手,用户可能需要面临阅读冗长的案例、寻找事实和争议焦点之间的相似性等中间流程,最终经过层层分析,才能输出一份优良的类案检索报告。
在大模型的时代,通过模型总结和生成的能力,用户可以通过大模型针对类案生成检索总结,从而快速提升案件阅读速度、待选类案的确认和裁判观点的归纳。
“ DeepSeek ” 与 “ 得理法律大模型 ”
基于以上场景,我们尝试先让两个AI生成一份有关生产、销售有毒、有害食品罪的刑事领域类案检索总结,看看两个模型是否可以胜任这一场景。
同时,根据律师、法务制作类案检索报告的任务特性,我们也厘定了一些评判准则:
-
文本提取的准确性:模型分析/推理个案的核心事实、争议焦点和法律适用部分,需与用户所上传现实世界数据保持一定的对齐度,避免遗漏某一(些)对于法官自由心证影响较大的要点,从而使得相关结果的可参考性有所降低。
-
结果归纳的准确性和合理性:模型能够基于类案信息,归纳、比较和分析裁判结果和理由的异同。所涉结论需基于用户所提供的类案,不出现幻觉。
-
个性化指令的跟随性:实务人士如果想要的并非是流于形式的案件堆砌,而是一次真正有参考意义的类案检索输出,则还需要关注个案之间基本事实是否实质性相似,要件涵摄过程是否类似,以及案件所使用的法律规范是否已经过时等注意事项。因此,用户输入个性化的上下文,是否都能激活对应的注意力单元,从而被模型成功捕捉并对输出进行约束,亦为一个考察方向。
要说明的是,以小理AI为例,少数法律专业垂类大模型本身已接通自有案例数据库,并配置了“AI案例检索总结”等功能,因此类案总结工作流很多时候不需要太“循规蹈矩”。案例检索跟总结生成融合在一个工作流中,双功能的便利性不言而喻。
但为便于对比,我们不妨先把两种模型“拉”回同一起跑线上:由于两个模型都支持“基于文档分析的生成”,因此我们以上传类案文档的方式进行测试,案例来源为中国裁判文书网,数量为4个。第一轮,我们仅单纯考察**【总结】**的能力,因此我们使用了较为简短的,直接与争议焦点相关的语句作为Query:
问题1:在动物饲料中添加克伦特罗,并在宰杀后的肉类中检测出超量的克伦特罗残留,应当定什么罪?如适用不同罪名,理由是什么?
先看Deepseek的结果:



再看看小理的结果:


从结果上来看,两个模型生产的结果与原文书之间均有较高的信息对齐度。对于简式的案例总结而言,Deepseek的推理能力还是有可圈可点之处。在显式的推理过程中,它至少进行了三次思考:第一次是针对多数裁判倾向的归纳,第二次是结合了用户Query的意图去对事实类似但法律适用却不同的少数类案提出疑问,第三次则是利用要件拆解+各种法律解释方法对两罪进行区分,并分别说理何种情况应当构成何种罪名。
而从小理的生成的结果来看,在指令高度相似的情况下,其回复相较Deepseek而言没有那么发散,同时因为趋为严谨的微调取向,使得模型的幻觉问题会比Deepseek要小。例如,Deepseek生产的回答中,对于罪名区分的部分,它提到以“危害程度”“残留量”来作为区分上述两罪的界限,这个结论存在明显的瑕疵,因为生产、销售有毒、有害食品罪属于行为犯。
另一个角度来看,对于第四个案件,该案之所以以生产、销售不符合食品安全标准的食品罪定谳而非另一个罪名,盖因其缺乏在食品中添加非食品原料的主观故意。因此,按照类案遴选的规则,该案跟我们所需的理想类案存在事实差异,严格来说理应在检索阶段予以筛除。
因此,第二轮,我们尝试升级一下挑战,通过构造一个更为还原类案检索报告工作全流程形式的指令,看看Deepseek是否能够也能够把类案遴选的推理加进自己的思维链(CoT)之中,以及小理的表现如何:
问题2:请针对以下争议焦点,比较类案的法律适用和裁判结果,并生成详略得当的检索总结报告:在动物饲料中添加克伦特罗,并在宰杀后的肉类中检测出超量的克伦特罗残留,应当定什么罪?如适用不同罪名,理由是什么?
比较时,请注意以下3点:
1、个案核心事实如差异较大,则不选作类案;
2、个案未生效,则削弱权重并作简要提醒。如已被推翻,则不选作类案。
3、个案适用如与现行规定有出入,作简要提醒。
Deepseek的结果:




从显式推理中可以看出,关于案例4的问题,Deepseek的思考似乎更“深”了一点:它想到了有可能是案件事实中没有体现行为人有添加有毒的非食品原料的故意,导致适用另一个罪名,但它最终还是没有按照指令把相关案件剔除出去。对此,小理模型的表现与Deepseek类似(图略),没有剔除相关案例。因此,两个模型在模拟更完整的类案检索总结工作流上,均有提升的空间。
结语
Deepseek的推理模型面世至今,不可谓不惊艳。基于多头潜在注意力(MLA)、混合专家架构(MoE)、负载均衡优化的技术架构,Deepseek在推理的速度上有了质的飞跃。在冷启动阶段所用的优质长思维链数据,也深刻地影响了模型思考的特性。
2024最新版优快云大礼包:《AGI大模型学习资源包》免费分享**
一、2025最新大模型学习路线
一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。

L1级别:AI大模型时代的华丽登场
L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。

L2级别:AI大模型RAG应用开发工程
L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3级别:大模型Agent应用架构进阶实践
L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。

L4级别:大模型微调与私有化部署
L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。
二、大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)

三、大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。

四、大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

五、大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取

567

被折叠的 条评论
为什么被折叠?



