专利检索与信息检索实验数据提取研究
在专利检索和信息检索(IR)实验领域,可重复性研究是一个重要的议题。本文将围绕专利检索中集合选择算法的性能,以及从IR论文中提取纳米出版物以支持实验可重复性的相关内容展开探讨。
专利检索中集合选择算法的性能
在专利检索中,集合选择算法对于帮助专利审查员识别相关的国际专利分类(IPC)代码具有重要意义。研究人员对多种集合选择算法进行了测试,测试基于CLEF - IP集合,并将其按IPC的子类(split3)、主组(split4)和子组(split5)划分为主题组织的子集合。
算法 | split3表现 | split4表现 | split5表现 |
---|---|---|---|
CORI | 在建议的前40个集合中识别超过95%的相关文档 | 性能下降 | 性能提升 |
BordaFuse | - | 性能呈下降趋势 | 性能呈下降趋势 |
ReciRank | - | 性能呈下降趋势 | 性能呈下降趋势 |
Espacenet搜索服务(子类级别,split3) |