利用教科书知识进行法规检索和蕴含分类
1. 引言
在法律领域开发人工智能极具挑战性。从表面看,法律术语似乎规范有序,适合形式化处理。但目前模仿人类推理的范围非常有限,且短期内难以实现广泛应用。随着法律规范和司法管辖区数量的不断增加,如何为律师提供支持成为关键问题。法律信息检索旨在帮助律师找到相关法律,而未来的蕴含分类器可能会为与特定法律集相矛盾的场景提供见解。
尽管近年来基于Transformer的架构在许多信息检索和蕴含分类任务中取得了显著进展,但法律领域的日常任务仍需要比现有大型通用模型更强的问题解决能力。理解法规相关性和蕴含关系所需的知识可能高度特定于某个司法管辖区,并且法规本身可能并未包含这些知识。因此,从教科书和网络资源中获取法规情境应用的知识是一种有效的解决方案。本文的主要贡献如下:
- 使用基于规则的方法提取教科书关于法规的知识。
- 将该知识应用于结合两阶段词频 - 逆文档频率(TF - IDF)和句子嵌入的法规检索方法中。
- 测试在图神经网络中对外部知识进行编码的不同方法,以用于蕴含分类任务。
2. 相关工作
在法律领域,从教科书中提取信息并不常见。研究人员通常专注于法规本身以创建引用网络,或在法律案例中检测对法规的引用。Winkels等人提出了引用法规的原因,并提取法规引用周围的关键词。本文也采纳了这一基本概念,将包含法规条文引用的句子视为该条文情境应用的有用信息来源。此前,研究团队开发了使用GATE和Apache UIMA Ruta从教科书中提取法规知识的流程,该流程基于一组有限的模式,用于检测文本中的条文提及并检索周围的句子作为潜在的有用上下文信息。
超级会员免费看
订阅专栏 解锁全文
2827

被折叠的 条评论
为什么被折叠?



