将卷积神经网络应用于法律问答
1. 任务描述
法律问答可分解为多个中间步骤。例如,对于 “是否可以制定免除担保责任的特殊条款,但在这种情况下,如果卖方为第三方自行设定了权利,卖方是否不免除担保责任?” 这样的问题,系统需先识别并检索相关文档(通常是法律条文),接着找出最相关的句子,最后比较问题与相关句子的语义联系,判断是否存在蕴含关系。
深度神经网络(DNNs)是一项新兴技术,在语音特征提取和识别等多个领域取得了显著成功。将卷积和池化操作引入神经网络,催生了卷积神经网络(CNNs)。CNNs 在图像和语音识别方面表现出色,许多研究也提议将其应用于自然语言处理。这里我们将 CNN 应用于法律问答,尤其关注文本蕴含问题。使用多层神经网络等更深层次模型的主要动机是,与浅层神经网络模型相比,它们在表示效率上更具潜力。在文本蕴含任务中,我们会提取两个句子间的语言特征,并通过比较这些特征来判断文本蕴含关系。由于并非所有语言特征都直接相关,我们打算捕捉相关特征并进行局部连接。CNN 的一个主要动机是通过使用被称为感受野的局部连接来限制网络架构。
2015 年法律信息提取/蕴含竞赛(COLIEE)聚焦于法律信息处理的两个方面,即回答法律考试中的是非问题:法律文档检索(阶段 1)和法律查询的是非问题文本蕴含判断(阶段 2)。
阶段 1 是一个临时信息检索(IR)任务,目标是检索与法律考试最相关的日本民法条文。我们采用基于统计信息的两种模型来解决这个问题:
- TF - IDF 模型 :即词频 - 逆文档频率。查询与文档的相关性取决于它们的交集词集。词的重要性由词频和文档频率的函数衡量。我们使用的词是经过词形还原的,例如 “atte
超级会员免费看
订阅专栏 解锁全文
970

被折叠的 条评论
为什么被折叠?



