基于香农熵的多发性硬化症分类研究
1. 研究背景与目标
多发性硬化症(MS)是一种影响中枢神经系统的神经退行性自身免疫性疾病,其病程在个体间差异较大,具有瞬态特性和动态变化的性质,同时伴有高度的不确定性。因此,及时诊断和预测MS的长期残疾进程是一个极具挑战性的复杂过程。本研究的目标是通过一系列方法,实现对MS的三个亚组(RRMS、SPMS和PPMS)以及健康个体的准确分类。
2. 研究方法与步骤
研究主要通过以下步骤实现目标:
1. 特征选择与转换 :对MS数据集应用基于熵的特征选择方法(香农熵和MRMR)以及线性变换方法(PCA和LDA)。
2. 生成新数据集 :基于MS数据集,得到四个具有新显著属性的新数据集,分别为香农熵 - MS数据集、MRMR - MS数据集、PCA - MS数据集和LDA - MS数据集。
3. 模型训练与评估 :将每个新数据集作为输入,用于k - 近邻(k - NN)和决策树算法的训练过程,并比较这两种算法在新数据集上对MS亚组分类的准确率。
3. 实验结果分析
通过决策树算法分类器的混淆矩阵,评估了分类准确率。以下是不同特征选择方法下,k - NN和决策树算法的优化结果:
| 特征选择方法 | k - 近邻(%) | 决策树(%) |
| — | — | — |
| PCA - MS数据集(139 × 228) | 57.60 | 54 |
| LDA - MS数据集(139 × 228) | 51.80 | 48.90
超级会员免费看
订阅专栏 解锁全文
1082

被折叠的 条评论
为什么被折叠?



