生物医学信息提取与非递归LPADs学习:理论与实践
1. 生物医学信息提取中的递归模式学习
在生物医学信息提取领域,我们常常需要从大量的文本中挖掘出有价值的信息。例如,识别特定的生物医学概念及其之间的关系。递归模式学习在这方面发挥着重要作用。
我们发现了一些有意义的依赖关系,比如:
- 类型标注依赖 :
- annotation(X1)=type ←follows(X1,X2)=true, word frequency(X2) ∈[8..140], follows(X3,X1)=true, annotation(X3)=substitution
- 这个规则表明,如果 X1 位于一个频繁出现的标记之前,并且在一个被标注为 substitution 的标记之后,那么 X1 可以被标注为 type 。例如,像 “an A-to-G mutation at position 3426 (tRNALeu)” 这样的模式就符合这种情况。
- 位置标注依赖 :
- annotation(X1)=position ←follows(X2,X1)=true, annotation(X2)=substitution, follows(X3,X1)=true, follows(X1,X4)=true, word frequency(X4) ∈[6..6], annotation(X3)=type, follows(X1,X5)=tru
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



