mutual information&mRMR

本文介绍了互信息的概念及其在特征选择中的应用,包括最大决定性、最大相关性和最小冗余性的定义与使用方法。

互信息

给定两个随机变量x,y,他们的互信息(mutual information)有他们的概率密度函数来定义

 

    

最大决定性(max-dependency)

把互信息的思想用在特征选择上,我们是要选取一个特征子集,使得能最好的决定相关类别,我们管这个叫最大决定性(Max-Dependency),定义如下

    

由此可见

 

    

最大相关和最小冗余(max-relevance and min-redundancy)

定义最大相关性

最大相关性是特征与类别之间的相关性

    

最小冗余性: 两两特征之间的冗余性

    

把这两个概念相结合,我们用Max-R 和Min-R 来作为特征选择的原则,即希望选取,与类别最相关并且相互之间冗余性最小的特征。

    

显然,如果是像Max-Dependency 一样的化,直接选取子集,是一个NPhard 问题。

在实际操作上我们都是用用增量选取的方式来解决这个问题的,当已经有时,从剩下的特征集合中选择,显然我们希望选一个和类别最相关并且和已有的特征之间冗余性最小的特征

    

转载于:https://www.cnblogs.com/chend926/archive/2012/06/01/2530612.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值