论文名称:What About the Precedent: An Information-Theoretic Analysis of Common Law
论文ArXiv下载地址:https://arxiv.org/abs/2104.12133
论文NAACL官方下载地址:https://aclanthology.org/2021.naacl-main.181/(有作者官方的NAACL讲解视频。这个作者的口音是我这几天来听过最正的英语了!)
官方GitHub项目:valvoda/Precedent
本文是2021年NAACL论文,作者来自剑桥。
在海洋法系中援引先例很重要,本文分析两种法律理论哪种更符合事实:一种是先例的裁决理由部分对本案裁决结果影响更大,一种是先例的事实部分对本案裁决结果影响更大。本文采用信息论的观点,将法律判决任务建模为分类任务,通过计算这两部分分别与判决结果的互信息,最后证明是先例的裁决理由部分影响更大。此外还分析了另一种理论成立的部分案例的原因。
比较信息熵/这两者各自和案例结果的互信息的大小,具体来说比较的是这两个东西:
即希望从判决结果中分离出判决理由。
呃这一篇就是,特别数学……
1. Background
- Halsbury’s:认为先例的arguments是重点(实验结果:√)
Goodhart’s:认为先例的事实是重点
(前者比后者更强调推理,后者的假设是如果不想和先例一样,说先例事实不同比推翻先例更容易) - ratio decidendi:判决理由,文中指以先例的arguments或者facts作为判决理由。
2. 模型
用神经网络来近似:
3. 实验
3.1 数据集
ECHR数据集,案例文本可切分为facts, arguments(法官的解释) and outcome. Arguments cite relevant cases, also known as the precedent
子语料:包含去重的案例引用关系
3.2 实验设置
Longformer
超参:由于资源有限,隐藏层维度50,batch size 16,将每个案例truncate到512个tokens。
4 Nvidia P100 16GiB GPU
最多6小时
3.3 实验结果
交叉熵小、MI大
探讨了一些法条跟别的法条不一样的情况,比如因为发生太晚所以被truncate了……