法律信息检索与判决理由提取的研究进展
1. COLIEE信息检索任务数据分析
1.1 Indri排名的作用
在法律信息检索中,Indri排名可有效估计问题难度和提交运行的特征。对于相关文章排名较高(但非第一)的问题,一些提交的运行通过引入面向领域的技术(如句子结构分析和法律术语)提高了检索结果的质量。例如,对于问题“H28 - 1 - 5: ‘A minor may not become an agent’”,Indri将包含关键词“minor”和“agent”的第158条文章排在首位,但两个英语运行(iLis7和JNLP)却将讨论成为代理人要求的第102条文章排在首位,而该文章中并未出现“minor”一词,其Indri排名在英语中为21。
1.2 检索低Indri排名相关文章的困难
然而,检索低Indri排名的相关文章较为困难。即使是最佳运行系统,也难以找到Indri排名低于5的相关文章。尽管许多团队引入了多种语义处理方法(如WordNet和word2vec),但目前仍不足以处理此类语义关系。
1.3 问题类型分类
为了改进未来的COLIEE信息检索任务,可引入问题类型分类,将主题分为以下几类:
| 问题类型 | 描述 | 示例 |
| ---- | ---- | ---- |
| 简单问题 | 不需要高级技术(如句子结构分析或语义知识)的简单问题,相关文章的Indri排名可能较高 | H24 - 16 - 4:“If an inheritance of a revolving mortgagee commences before the principal is fixed…”
超级会员免费看
订阅专栏 解锁全文
1216

被折叠的 条评论
为什么被折叠?



