缩写含义推断与词汇本体扩展实验研究
在医学和语言学等领域,缩写词(ABR)的含义推断以及词汇本体的扩展是重要的研究方向。本文将介绍两方面的研究内容,一是临床研究中缩写词含义的推断方法,二是扩大葡萄牙统一词汇本体(PULO)覆盖范围的实验。
临床研究中缩写词含义推断
在临床研究中,缩写词(ABR)的使用非常普遍,但很多时候其完整表达(EXP)并未给出。为了准确推断ABR的含义,研究人员采用了多种方法。
- 基于Mesh术语和Tree IDs的方法 :根据自动检测到的Mesh术语(如从研究标题中获取)检索每个ABR的Tree IDs,并检查相应的Tree IDs图以找到最佳匹配的EXP。不过,该分析表明只有85%的EXP被正确检测到,略低于之前的情况。
- 结合邻近术语的方法 :检查每个EXP附近的术语。具体步骤如下:
1. 收集与ABR出现在同一句子中的不同标记(即词干),忽略标点符号、停用词和数字。
2. 使用无EXP的ABR的前后标记,在带注释的文档语料库中选择合适的EXP。为每个ABR选择的EXP是标记匹配重要性总和最大的那个。通过这种方法,88%的ABR - EXP推断被正确检测到。例如,成功将高度歧义的ABR “AR” 的含义解析为 “Allergic rhinitis”,而之前的技术无法正确检测到该含义(“AR” 的主要EXP通常是 “Androgen Receptor”)。
在ABR - EXP检测过程中,存在一些影响因素:
- 文档中的错误和不一致性 :作者可能在同一文档中使用与指定形式不同的ABR,或者
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



