3、提升检索效果的组合语言处理方法与混搭系统

最新推荐文章于 2025-11-28 12:19:44 发布

a1b2c

最新推荐文章于 2025-11-28 12:19:44 发布

阅读量385

点赞数

CC 4.0 BY-SA版权

分类专栏：信息检索前沿：多学科视角下的创新与应用文章标签：专利检索组合语言处理混搭系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/a1b2c/article/details/149515859

信息检索前沿：多学科视角下的创新与应用专栏收录该内容

16 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

提升检索效果的组合语言处理方法与混搭系统

在专利检索领域，由于数据库规模庞大、涉及专业术语以及使用场景多样，单一技术往往难以满足需求。因此，采用多种不同技术来从大型专利源中检索相关文档变得至关重要。

1. 文档相似度计算与排序

首先，通过公式 2 来计算文档间的相似度：
[
\sum_{RSec} \frac{SSM[RSec]}{N[RSec]} = SSM_{PAIR}
]
其中，$SSM_{PAIR}$ 表示列表中相邻检索项之间的总相似度指标，$N[RSec]$ 表示用于相似度测量的文档部分数量。之后，比较器会遍历结果列表，比较后续项序列的相似度指标，并按降序重新排序。这个过程会多次重复，直到达到给定的阈值（后续文档之间的相似度距离），从而使结果列表中相邻两项的相似度达到最大。

2. 糖尿病相关专利搜索的混搭系统

为了降低搜索糖尿病专利数据库的难度，并提供快速、最新的药物数据访问，构建了一个混搭服务系统，该系统包含四个模块：
- 糖尿病药物搜索模块 ：可对整个药物数据库进行搜索，包括对可用字段的全文搜索。这是一种基于简单关键字的搜索，界面简单，用户访问方便。结果根据关键字频率排名，每个药物项可在原始来源（如 DailyMed 或 DrugBank）中查看。
- 糖尿病相关专利搜索组件 ：能从全球数据库中搜索与糖尿病药物相关的专利。还实现了高级搜索选项，如根据特定专利特征（如引用、出版物）搜索、搜索相似数据或相关专利等。专利可直接在商标局（如 UPSTO、EPO、WIPO）以原始格式查看。
-

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。