利用机器学习技术进行中医诊断
1. 引言
随着数字化数据收集的增加,中医临床数据分析引起了中医研究者和机器学习科学家的更多关注。各种成熟的机器学习技术有助于在中医数据分析中取得显著进展。然而,考虑到中医自身的特点,其数据分析研究仍给机器学习技术带来了巨大挑战:
- 高维特征挑战 :临床过程中可记录大量症状,但高维特征会损害机器学习方法的建模性能。因此,在数据分析过程中为特定疾病选择合适的症状子集是数据建模和理解的关键问题。
- 多类别和多标签问题 :中医诊断中,患者通常被诊断为患有多种证候。临床数据建模可抽象为多类别甚至多标签问题,而现有机器学习技术在二分类方面表现出色,多类别和多标签建模仍是机器学习研究的挑战。
为应对这些挑战,本文介绍了判别症状选择和多证候学习的新技术,应用包括唇诊特征选择、冠心病问诊症状选择、医学诊断的多证候分类以及基于特征融合的高血压证候分类。
目前大多数中医机器学习工作未考虑特征间的医学意义和联系,而中医数据包含大量具有特定医学意义的症状或证候,因此寻找症状和证候等特征之间的联系也很重要。在中医诊断数据集中,某些症状可能是冗余的,选择主要或相关症状对机器学习性能至关重要。以往有多种方法用于症状选择,但传统方法存在难以用中医理论解释的问题,本文旨在使用相对关联密度(RAD)进行症状选择,并评估结果是否能更好地用中医理论解释。
多标签学习通常涉及高维数据,但由于其复杂性,适用于多标签数据的降维和特征选择方法很少。现有一些特征降维方法如MDDM、线性降维等,但存在无法获取原始低维特征的问题,不利于科学问题的理解。
特征选择旨在
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



