[模式识别].(希腊)西奥多里蒂斯<第四版>笔记5之__特征选取

本文探讨了模式识别中特征选择的重要性,特别是在面对高维度数据时。文中介绍了特征选择的基本概念,包括减少维数的方法,如离群值删除、数据归一化等预处理手段,并讨论了峰值现象及基于统计假设的特征选择方法。

1,引言

有关模式识别的一个主要问题是维数灾难。我们将在第7章看到维数非常easy变得非常大。

    减少维数的必要性有几方面的原因。计算复杂度是一个方面。还有一个有关分类器的泛化性能。

    因此,本章的主要任务是:在尽可能保留特征的分类判别信息前提下,来选择重要的和维数少的特征量。这个过程被称作特征选择或者特征降维。

    定量描写叙述来讲,选择的特征应该使得类内距离减小,类间距离增大。

    一些文献表述中使用feature extraction,而不是我们本文使用的featureselection。这将会和第7章的一些描写叙述有些冲突。

    2。预处理

① 离群值删除(outlier removal)

离群值定义为偏离相关变量均值较大的点

② 数据归一化

很多特征值位于不同的动态阈中。而大的特征值对损耗函数会有较大影响。所以归一化到相似阈值会有帮助。

③ 缺失数据

一些特征会从特征量量中缺失。比如遥感在特定区域被其它传感器覆盖的情况就是如此。

3。峰值现象

4,基于统计如果的特征选取

5,接收操作(THE RECEIVER OPERATING)特性曲线

6。类可分性度量

7。特征子集选取

8,最优特征代(OPTIMAL FEATURE GENERATION)

9。神经网络和特征选取

10,一个提示泛化理论

11。贝叶斯信息标准

转载于:https://www.cnblogs.com/yfceshi/p/6738756.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值