7、专利检索与信息检索实验数据提取研究

专利检索与信息检索实验数据提取研究

在专利检索和信息检索(IR)实验领域,可重复性研究是一个重要的议题。本文将围绕专利检索中集合选择算法的性能,以及从IR论文中提取纳米出版物以支持实验可重复性的相关内容展开探讨。

专利检索中集合选择算法的性能

在专利检索中,集合选择算法对于帮助专利审查员识别相关的国际专利分类(IPC)代码具有重要意义。研究人员对多种集合选择算法进行了测试,测试基于CLEF - IP集合,并将其按IPC的子类(split3)、主组(split4)和子组(split5)划分为主题组织的子集合。

算法 split3表现 split4表现 split5表现
CORI 在建议的前40个集合中识别超过95%的相关文档 性能下降 性能提升
BordaFuse - 性能呈下降趋势 性能呈下降趋势
ReciRank - 性能呈下降趋势 性能呈下降趋势
Espacenet搜索服务(子类级别,split3)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值