16、生物知识数据库的置信标记物研究

生物知识数据库的置信标记物研究

在生物学和医学领域,从科学文献中提取可靠的知识至关重要。本文将介绍一种通过识别和分类置信标记物来评估知识可靠性的方法,以及该方法在与阿尔茨海默病相关基因研究中的应用。

1. 置信标记物的概念

置信标记物是指能够隐含或明确传达信息,用于证明从文本中提取的知识可靠性的各种元素。这些元素可以分为内在和外在两类,包括:
- 语言修饰词(hedges) :如“might”“maybe”等表示作者对断言不确定的词汇。
- 语言和语法模态 :例如使用被动语态、特定的语气等。
- 期刊影响因子(impact factor) :反映期刊发表的文章在学术界的影响力和可信度。
- 研究类型 :实验研究、理论研究、临床实验等不同类型的研究对知识的可靠性有不同的影响。
- 作者所属机构 :知名机构的作者发表的文章可能更具可信度。
- 文章发表日期 :较新的研究可能更能反映当前的科学进展。

在本次研究中,主要考虑前三种类型的置信标记物。

2. 研究材料

研究使用了三个来自Pubmed的语料库:
| 语料库名称 | 描述 | 规模 |
| — | — | — |
| CaRPI | 由160个疑似与阿尔茨海默病相关的人类候选基因生成,包含355篇摘要,817个句子,213,618个单词,大小为1MB。 | 355篇摘要 |

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值