专利先验技术搜索查询增强与网页垃圾邮件检测
1. 专利先验技术搜索查询增强
在专利先验技术搜索中,为了优化查询表述,进行了相关实验。采用了两种方法:关键词依赖关系(KDR)和语义标签(IFPS)。查询提取方式是从每个字段或两个、三个字段的组合中选取前N个术语。
- 实验设置 :对三种国际专利分类(IPC)代码,即子类、主组和分组的检索结果进行评估,并与基于词频 - 逆文档频率(tf - idf)方法得到的结果进行对比。
- 实验结果
- 字段有效性 :与摘要或权利要求书相比,说明书字段在查询表述中最为有用。不过,将各字段的前N个术语组合起来,性能比单独使用任何一个字段都要好。
- 方法性能 :KDR和IFPS的性能优于tf - idf,而当KDR和IFPS结合使用时,性能最佳。特别是在使用摘要或权利要求书中较短或更简洁的文本进行查询表述时,基于IFPS的查询表述尤为有用。
- IPC分类差异 :对于每种IPC分类类型,来自不同字段的术语在IPC分类识别中会产生不同的结果。
以下是实验的简单流程图示:
graph LR
A[选择查询方法] --> B[KDR]
A --> C[IFPS]
B --> D[从字段提取术语]
C --> D
D --> E[组合字段术语]
E --> F[检索结果评估]
超级会员免费看
订阅专栏 解锁全文
1084

被折叠的 条评论
为什么被折叠?



