无监督特征选择的免疫多目标优化算法
1. 引言
在数据处理中,我们往往会直观地认为更多的特征能够更好地描述目标,有助于提升判别性能。然而在实际情况中并非如此。我们可以为许多学习领域提取潜在有用的特征,但其中一些特征可能是冗余或无关的,甚至会误导学习结果。在这种情况下,去除这些“噪声”特征通常能带来更好的性能。
特征选择是指通过消除冗余特征和那些预测信息很少或没有预测信息的特征,从原始预测变量中选择一个子集的过程。在监督学习中,这是一种常用技术,已广泛应用于各种领域,因为它可以提高分类器的性能,降低甚至避免维度灾难。根据评估标准,特征选择算法可分为过滤式(filters)和包装式(wrappers)。过滤式方法独立于任何学习算法进行特征选择,而包装式方法则通过分类准确率来评估候选特征子集。
与监督学习相比,无监督特征选择的研究近年来才逐渐展开。无监督特征选择算法同样可分为过滤式和包装式方法。基于距离熵的算法和基于特征相似度的方法属于过滤式方法,而大多数无监督特征选择的研究属于包装式方法。
本文提出了一种基于包装式框架的无监督特征选择算法,其中应用模糊C均值(FCM)算法基于所选特征形成聚类。一般来说,特征选择算法涉及两个方面:特征评估标准和搜索算法。本文采用模糊聚类的有效性度量来评估FCM算法中特征的质量。此外,在无监督特征选择中,合适的特征选择和恰当的聚类数必须同时进行优化,因为不同的特征子集可能导致不同的聚类结构,这是一个多准则优化问题。最近,进化计算算法在特征选择和合成中得到了广泛应用,以提高性能并降低特征维度。然而,将免疫克隆算法(ICA)用于特征选择时,难以探索不同目标之间的权衡可能性。因此,本文使用免疫遗忘多目标优化算法(IFMOA)来寻找一组非支配
无监督特征选择的免疫多目标优化算法
超级会员免费看
订阅专栏 解锁全文
23

被折叠的 条评论
为什么被折叠?



