论文原文:Querying Across Genres for Medical Claims in News
摘要
我们提出了一个基于查询的生物医学信息检索任务,跨越两种截然不同的类型——新闻专线和研究文献——其目标是找到支持与健康相关的新闻文章中提出的主要主张的研究出版物。为了完成这项任务,我们提出了一个新的数据集,其中包含5034条来自新闻和研究摘要的声明。我们的方法包括两个步骤:(i)从222k个研究摘要中选择最相关的候选对象,以及(ii)对该列表进行重新排序。我们比较了使用BM25的经典IR方法与最近基于transformer的模型。我们的研究结果表明,跨类型医学IR是一项可行的任务,但纳入特定领域的知识是至关重要的。
IR: Information Retrieval 信息检索
变压器:transformer
介绍
近年来,一般人群越来越多地在网上寻找医疗信息来源。
在各种类型的来源中,他们主要依赖于在线新闻文章,这些文章通常用于传播研究的医学发现(Medlock et al, 2015)。然而,重要的是确定医疗索赔的来源,特别是在错误信息普遍存在和大流行期间,人们可能无法去看医疗保健专业人员。在报道医学研究时,许多新闻文章通过嵌入超链接或明确显示引文来引用原始研究,从而为读者提供可信度的关键标志。
然而,并不是所有的文章都这样做。在这里,我们展示了我们在寻找科学研究出版物方面的工作,这些出版物支持与健康相关的新闻文章中提出的主要主张。我们将其设计为基于跨类型查询(或特设)的信息检索(IR):给定新闻文章中提出的医疗声明,检索支持该声明的研究出版物
喝茶的人更长寿
喝茶的人寿命更长,其中绿色变体的寿命延长幅度最大
饮茶与动脉粥样硬化性心血管疾病和全因死亡率的降低有关,尤其是在习惯饮茶的人群中。
www.sciencedaily.com/releases/2020/01/200109105508.htm(访问日期:2020年5月31日)引用了源代码并提供了一个超链接。
www.telegraph.co.uk/news/2020/01/09/tea-drinkers-liveyear-half-longer(访问日期:2020年5月31日)来源信息不完整,没有原始研究的超链接。
表1:跨类型医疗IR,其中索赔要求(1a和1b)在新闻中以非专业术语呈现,并作为查询。支持(2)在研究出版物中提供,用专业语言表达。