语言图对齐与医疗案例推理技术解析
1. 语言图对齐概述
在以往研究语言相似度时,常通过句法分析树的最大公共子树来计算,还借助短语级对齐来近似寻找最大公共子树。为全面追踪不同语言层次(短语、句子、段落)的短语结构,采用全规模图对齐方法,避免丢失潜在重要的语言特征,这些特征对匹配患者症状描述和医生症状检查说明至关重要。
对齐操作在匹配患者记录和标记案例时十分关键,涉及分布语义、句法和语义匹配。这里先介绍受生物应用启发的抽象图对齐算法,其一种实现可用于代码相似度评估。
2. 抽象意义表示(AMR)
2.1 AMR简介
抽象意义表示(AMR)是一种通用的意义表示语言,用于广泛覆盖文本。它为计算语言学家研究宽覆盖语义解析的语法归纳问题提供了新的大型语料库,但也给现有算法带来挑战,如长句子、复杂句法现象和非组合语义的增加。
AMR旨在从各种句法表述中抽象出来,为具有相同基本含义但表述不同的句子分配相同的AMR。它采用树状表示格式,是有根、有向、边和叶都有标记的树。
例如,“The doctor prepares to leave.”的AMR表示为:
(w / prepare
:arg0 (b / doctor)
:arg1 (g / leave
:arg0 b))
逻辑形式为:
∃ w, b, g: instance(w, prepare) ∧ instance(g, leave)
∧ instance(b, doctor) ∧ arg0(w, b)
∧ arg1(w, g) ∧ arg0(g, b)
超级会员免费看
订阅专栏 解锁全文
42

被折叠的 条评论
为什么被折叠?



