临床研究中缩写含义推断的深入解析
1. 缩写理解的基础与挑战
缩写(ABR)的含义对于理解其代表的内容至关重要。一般来说,ABR 可能有一个或多个含义(即意义),每个意义又可以用一个或多个扩展形式(EXP)来表达。在本研究中,运用先进的字符串文本处理技术后,彼此非常相似的 EXP 被视为相同的。因此,由于每个 ABR 的可能 EXP 由完全不同的单词组成,EXP 与其意义之间通常存在一一对应关系。
在临床研究中,检测 ABR 的含义对人类来说都颇具难度,对软件代理而言更是如此。这是因为它们需要处理两种情况:一是文档中明确定义了 ABR 的情况(通常遵循特定模式,即缩写句法线索);二是文档中未提及 ABR 的 EXP 的情况。本研究聚焦于基于软件分析临床研究文档中 ABR 正确含义推断的结果。
2. 相关研究工作
生物医学领域的 ABR 研究已十分广泛,目前已提出多种检测其 EXP 的算法和技术:
- 文本对齐方法 :尝试根据使用的字符将 ABR 与其对应的 EXP 进行匹配,例如 Schwartz 和 Hearst 提出的算法。Park 和 Byrd 也提出了基于模式的规则方法来检测 ABR - EXP 对。若结合句法信息,文本对齐技术的效果还能进一步提升。
- 机器学习方法 :已应用于 ABR 识别,如利用监督机器学习从 MEDLINE 创建 ABR 字典。
- 统计方法 :例如 ADAM 算法,在对应 EXP 出现频率足够高的情况下可用于缩写识别。不过,为提供有价值的结果,它需要大量生物医学文章,同时也需要充足
超级会员免费看
订阅专栏 解锁全文
61

被折叠的 条评论
为什么被折叠?



