整合多技术提升医疗数据分类性能
在医疗数据分类领域,提升分类性能至关重要。当前的医疗数据分类技术若不进行数据预处理,不仅耗时,而且分类准确率较低。为解决这些问题,提出了两种算法:BNFC和FBNFC,通过数据预处理和模糊神经分类器的结合,有效提高了分类准确率。
背景知识
真实世界的数据中往往包含噪声,这些噪声会对数据挖掘的各种分析任务产生显著影响,导致分类器性能下降,增加算法的时间复杂度。因此,数据清洗和特征子集选择成为提高分类模型效率的关键预处理措施。
- 去除数据噪声 :众多研究者提出了多种去除数据噪声的方法。例如,有的使用分类器过滤器去除训练数据集中的噪声元组;有的应用Occam’s razor减少噪声,提高数据中的推理知识和测试数据的分类效率;还有的采用饱和过滤器监测训练数据的饱和度,去除噪声样本以简化理论。
- 特征选择算法
- Sequential Floating Forward Selection (SFFS) :这是一种贪心搜索算法,可将初始的高维特征空间缩减为低维特征子空间,通过额外的排除或包含步骤,能够采样更多的特征子集组合。
- Semi - Supervised Feature Selection (LSFS) :该方法利用有标签和无标签的数据,以最大化数据的有效性,尤其适用于难以获取足够有标签数据的情况。
- 处理缺失数据
超级会员免费看
订阅专栏 解锁全文
1495

被折叠的 条评论
为什么被折叠?



