Ontology-Guided Query Expansion for Biomedical Document Retrieval using Large Language Models

最新推荐文章于 2025-11-25 12:11:01 发布

UnknownBody

最新推荐文章于 2025-11-25 12:11:01 发布

阅读量198

点赞数 3

CC 4.0 BY-SA版权

分类专栏： LLM Daily 文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/151176580

LLM Daily 专栏收录该内容

1691 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

文章总结与翻译

一、文章主要内容

本文聚焦生物医学文档检索中因领域特定词汇和用户查询语义模糊导致的检索效率低问题，提出了一种名为BMQExpander的本体感知查询扩展框架，旨在提升生物医学文档检索的有效性与稳健性。

核心技术流程

BMQExpander包含五个关键阶段，形成完整的查询扩展与检索闭环：

领域特定实体识别：通过少样本提示大型语言模型（LLM），从用户查询中提取核心生物医学术语，排除无医学意义的词汇，确保后续扩展的针对性。
本体驱动概念链接与定义检索：将提取的术语映射到UMLS（统一医学语言系统）的概念唯一标识符（CUI），并从MeSH、SNOMED CT等权威生物医学词汇表中检索对应概念的结构化定义，保证术语语义的准确性。
概念级知识图谱构建：围绕每个CUI构建语义图，筛选出CHD（有子概念）、PAR（有父概念）、SY（同义词）等具有医学意义的关系，剔除冗余关联，形成精简的结构化知识表示。
本体引导伪文档生成：将原始查询、序列化的概念定义与知识图谱作为提示输入LLM，生成符合医学事实的伪文档，同时通过“思维链”后缀促进LLM的逐步推理，减少生成错误。
加权查询扩展与检索：将原始查询重复指定次数（实验中α=5）后与伪文档拼接，形成最终扩展查询，再使用BM25模型对生物医学文档库进行检索

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。