疾病分类中的文本挖掘与深度学习
在医疗领域,疾病的准确分类对于诊断和治疗至关重要。文本挖掘和深度学习技术为疾病分类提供了新的方法和途径。本文将介绍疾病分类中涉及的文本挖掘和深度学习相关内容,包括否定和不确定发现的识别、疾病分类的进展以及具体的案例研究。
否定和不确定发现的识别
在放射学报告中,否定和不确定的发现很常见。例如,“No infiltrate or effusion” 中的 “effusion” 是否定发现,“suspicious pneumothorax” 中的 “pneumothorax” 是不确定发现。识别这些发现与识别阳性发现同样重要,否则下游的信息提取或图像分类算法可能会返回许多不相关的结果。
区分阳性、阴性和不确定发现仍然具有挑战性。以往的否定检测研究包括基于规则和机器学习的方法:
- 基于规则的方法 :依赖否定关键词和规则来确定否定。例如,NegEx 是一种广泛使用的算法,早期版本通过硬编码的词窗口大小(n = 5)限制范围,后期版本将范围扩展到句子末尾或允许用户设置窗口大小。为了克服固定窗口大小的限制,Sohn 等人提出在依赖路径上使用正则表达式,Mehrabi 等人在 NegEx 之后使用依赖模式作为后处理步骤来去除阴性发现的误报。
- 机器学习方法 :提供了另一种提取否定的途径,但需要手动标注的领域内数据来确保性能,且此类数据通常不公开可用。此外,基于机器学习的方法在泛化能力上往往较差。
疾病分类的进展
深度学习和大规模标注图像数据集在计算机视觉问题上取得了巨大进展,在目标识别、检测和分割等方面的定量性能相较于基
超级会员免费看
订阅专栏 解锁全文
1002

被折叠的 条评论
为什么被折叠?



