80、生物医学文献溯源元数据提取与RDF数据集类标注技术

生物医学文献溯源元数据提取与RDF数据集类标注技术

1. 生物医学文献溯源元数据提取

1.1 背景与需求

在生物医学研究中,溯源元数据对于支持研究的透明度和可重复性至关重要。随着研究的不断深入,手动从大量生物医学文献中提取溯源信息变得极为困难,因此需要开发自动化技术来解决这一问题。

1.2 ProvCaRe - NLP管道的开发

为了准确识别和提取生物医学文献中的溯源元数据,开发了ProvCaRe - NLP管道。该管道结合了现有自然语言处理(NLP)工具(如MetaMap和NCBO Annotator)对生物医学领域的广泛覆盖,以及专注的溯源命名实体识别(NER)任务,能够准确识别与ProvCaRe框架的三个组件相对应的溯源术语。

1.3 评估结果

使用20篇经过同行评审的文章作为文本语料库,对MetaMap、NCBO Annotator和ProvCaRe - NLP管道提取溯源术语的召回率进行了比较评估,结果如下表所示:
| Paper (Author last name and year of publication) | MetaMap | | NCBO Annotator | | MetaMap + NCBO Annotator | | ProvCaRe - NLP + MetaMap + NCBO Annotator | |
| — | — | — | — | — | — | — | — | — |
| | Full Article | Abstract + Method + Result | Full Article | Abstract + Methods + R

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值