医学文本信息提取与语义网语言转换研究
在医学领域和语义网领域,信息提取和语言转换是两个重要的研究方向。医学文本中蕴含着大量关于患者状态的数据,如何高效准确地提取这些信息并进行结构化表示是医学信息处理的关键;而在语义网中,不同语言之间的转换对于知识的共享和查询至关重要。
医学文本信息提取
在医学文本信息提取方面,主要采用了启发式策略进行文本分析和模板填充。
启发式策略
- 确定讨论感兴趣身体部位的短语和句子 :在患者记录(PR)状态文本中,先识别包含感兴趣身体部位 X 的句子 S,优先搜索处于句子主语位置的 X。然后考虑相邻句子 {S1, S2, …, Su},这些句子包含的概念实体与 X 存在特定关系,如通过 isa、part - of 和 has - location 关系关联的身体部位 {X1, X2, …, Xn},与 X 或 {X1, X2, …, Xn} 在解剖学上相关的身体部位 {Y1, Y2, …, Ym},以及与 X、{X1, X2, …, Xn} 或 {Y1, Y2, …, Ym} 在临床上相关的疾病、能力、特征 {Z1, Z2, …, Zk}。最后,使用从句子 S 和 {S1, S2, …, Su} 中提取的实体填充 X 的预定义信息提取(IE)模板,并评估所得结构化表示的精确率和召回率。
- 解决指称链接 :让 IE 系统在句子 S 和 {S1, S2, …, Su} 上对实体 X 进行模板填充。对于出现在这些句子中且包含在系统医学词汇表中的术语 T(T ≠ X),将其映射到 X 模板的预定义插槽或这些插槽的预定义值。如果无法映射
医学文本信息提取与语义网转换研究
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



