专利搜索与查询制定的技术探索
专利搜索中的查询扩展与词汇知识获取
在专利搜索领域,有效的查询扩展对于提高检索效率至关重要。为了实现这一目标,研究人员进行了一系列实验。
- 实验设置 :使用欧洲专利局(EPO)授予的专利文档集合,这些专利必须以EPO的官方语言(英语、法语或德语)之一提交。具体收集了特定国际专利分类(IPC)类A61C1的453份已授权欧洲专利,其中下载了276份全文文档,并从每份文档中提取了以法语、英语和德语发布的权利要求部分用于实验。
- SFT和词汇知识检测
- SFT检测 :在专利权利要求部分的SFT检测中,使用出现在SFT旁边的参考符号,通过参考符号的共词分析提取SFT。
- 词汇知识获取 :首先利用单词共现学习翻译关系。将权利要求部分中包含相同参考符号的二元组组合成翻译关系,具体操作步骤如下:
1. 过滤所有生成的权利要求集合的二元组,形式为“S R”,其中S是权利要求术语,特别是SFT,R是参考符号。
2. 过滤步骤1中检索到的二元组,筛选出具有相同参考符号且出现次数超过两次的二元组。
3. 基于包含相同参考符号的二元组生成翻译关系,并基于这些包含相等概念的学习关系学习同义词关系。
词汇关系 | 代码 | 语义关系 | 概念 |
---|---|---|---|
英语/德 |