特征选择方法:超图嵌入与计数网格模型
超图嵌入的无监督特征选择方法
在特征选择领域,有一种基于超图嵌入的无监督特征选择方法,它具有显著的优势。
方法优势
- 构建新颖超图框架 :通过纳入互信息指数(MII)进行高阶相似性度量,建立了一种新颖的超图框架。这个框架能够有效地刻画一组样本内的多重关系,从而更高效地对数据中潜在的结构信息进行建模。
- 特征判别分析回归化 :从超图嵌入的视角进行特征选择,将特征判别分析转化为一个考虑特征间相关性的回归框架。这样一来,就可以对联合特征组合进行评估,而非局限于逐个考虑特征,进而有效处理特征冗余问题。
基于计数网格的特征选择方法在微阵列数据中的应用
特征选择的重要性
在许多模式识别应用中,特征选择技术是重要的预处理工具。它可以消除无信息的特征,降低问题空间的维度,缓解维度灾难问题。在生物学等领域,每天的实验室程序会产生大量数据,特征选择步骤不可或缺。以表达微阵列数据分析为例,同时测量数千个基因的表达水平,但典型的分类任务只有几十个样本,每个样本却有数千个基因特征(即高维空间中的少量点)。在这种情况下,特征选择技术尤为重要,能够帮助医学/生物学研究人员识别出稳定且有信息价值的生物标志物,用于癌症诊断、预后和治疗靶向。
特征选择方法分类
过去在特征选择领域引入了大量方法,大致可分为三类:
- 过滤方法 :不与分类器系统交互,仅通过查看数据的内在属性进行选择。常见的做法是根
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



