法律领域问答系统与论证信息评估研究
1. 法律领域问答系统
在法律领域构建问答系统是一项具有挑战性的任务。研究者提出了一个包含三个阶段的模型,旨在解决法律问题的检索、推理和回答。
1.1 系统模型阶段
- 法律信息检索 :使用基于形态分析构建的混合大小n - 元语法模型,对与法律问题相关的文章进行排名和选择。
- 法律文本蕴含判断 :通过在词汇特征和分布式语义相似度上训练的机器学习算法,判断问题与检索到的文章对之间是否存在蕴含关系,以确定问题能否由文章正面或负面回答。
- 法律文本回答 :为用户提供正确的答案。
1.2 系统贡献
- 语言模型与相关性分析 :提出了一种简单而有效的法律语料库语言模型,并结合相关性分析方法(R2NC),能够充分利用该模型。
- 特征应用 :使用TF - IDF和Word2Vec相似度特征,将机器学习算法应用于识别文本蕴含(RTE)任务。
1.3 实验结果
在COLIEE竞赛中,R2NC在信息检索(IR)任务中表现出色,前3名文章的召回率达到0.64,F - 度量为0.508,获得第2名;在IR + 文本蕴含(TE)组合任务中,准确率为0.582,获得第3名。与基线相比,该方法在F - 度量上分别比SVM提高了8.4%,比Adaboost - SVMs提高了11.3%。