自然语言处理在医疗保健中的应用与深度学习方法
数据预处理技术的应用
临床自然语言处理(NLP)借助数据预处理技术,能够从电子健康记录(EHRs)、病理报告和护理报告等多种途径收集初始数据集。这些技术有助于改善 EHRs、降低风险,并在医疗保健中进行临床预测分析。例如,社交媒体文本可用于分析个人的情绪、情感和焦虑水平。
EHR 系统使自动化文档分类成为临床预测分析的重要研究领域。研究人员使用词袋表示法,直接从非结构化文本内容中识别和规范化词汇变体,作为临床特征表示的基线。Chen 等人的研究基于信息检索、命名实体识别(NER)、基于文献的发现和问答,以应对 COVID - 19 大流行带来的紧迫需求。他们对收集的数据块进行预处理时,应用了词干提取和词形还原技术,将每个单词转换为其基本形式或词根形式,并利用特定领域的同义词词典。
在问答方面,他们将问答引擎分为三组。第一步,大小写折叠、词形还原和停用词去除技术有助于简化句子,使复杂冗长的句子变得更简洁明了。利用这些技术,结合 NER 可以解决许多临床问题。当与预处理技术结合并在模型上进行训练时,收集的数据可以预测 EHRs 中记录的早期症状,如 COVID - 19 的症状与嗅觉丧失、发烧和寒战密切相关。
Samuel 等人在基于 COVID - 19 公众情绪分析对推文进行分类的研究中,使用了不同的预处理技术,如停用词去除、分词、词性标注、词干提取和词形还原。这些技术有助于提高模型的准确性和效率,因为冗余词会剥夺数据分析和预测的潜在机会。
医疗保健中自然语言处理的层次
医疗保健中 NLP 一般遵循以下步骤及其应用:
1. 词法分析
超级会员免费看
订阅专栏 解锁全文
3850

被折叠的 条评论
为什么被折叠?



