结合Scikit-learn介绍几种常用的特征选择方法
结合Scikit-learn介绍几种常用的特征选择方法
文档频率、互信息(信息增益,只是决策树中这样称呼)、
信息增益:
是指期望信息或者信息熵的有效减少量。对于一个特征t,系统有它和没它的时候信息量各是多少,两者的差值就是这个特征给系统带来的信息量。有它即信息熵,无它则是条件熵。
χ⊃2(卡方检验用来评价是两个事件是否独立,也就是P(AB) = P(A)*P(B));
统计量
...
转载
2018-08-09 22:32:06 ·
1532 阅读 ·
0 评论