
特征选择
Wolfly_Fu
这个作者很懒,什么都没留下…
展开
-
【转】几种常用的特征选择方法
结合Scikit-learn介绍几种常用的特征选择方法 原文 http://dataunion.org/14072.html https://blog.youkuaiyun.com/kebu12345678/article/details/78437118主题 特征选择 scikit-learn特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性...转载 2018-08-28 09:55:06 · 652 阅读 · 0 评论 -
机器学习之特征工程
机器学习之特征工程转自:http://www.csuldw.com/2015/10/24/2015-10-24%20feature%20engineering/ 在这个振奋人心的程序员节日里,我决定认真地写一篇文章来纪念一下自己这长达六年程序员史。o(╯□╰)o本文是一篇关于特征工程的总结类文章,如有不足之处或理解有偏差的地方,还望多多指教。首先,给一张特征工程的思维导图吧...转载 2018-08-28 14:09:45 · 305 阅读 · 0 评论 -
【译文】特征选择方法导论(如何选取合适的变量)
【译文】特征选择方法导论(如何选取合适的变量)作者 SAURAV KAUSHIK译者 钱亦欣引言我时常以参加竞赛的方式来磨练自己的机器学习技能,它能让你更清楚地了解自己的水平。一开始,我以为算法就是机器学习的一切,知道采用哪种模型就能走上人生巅峰。但后来我发觉自己拿衣服了,竞赛的赢家们使用的算法和其他人并无二致。而后,我认为这些人一定有很牛逼的机器,但当我发现有的top选手建模用的...转载 2018-08-28 14:33:34 · 1598 阅读 · 0 评论 -
特征工程到底是什么? - 城东的回答
作者:城东链接:https://www.zhihu.com/question/28641663/answer/110165221来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。我来写一个入门级的实践吧,为了保持连贯性,引用了全文:作者:城东链接:特征工程到底是什么? - 城东的回答来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明...转载 2018-08-28 14:52:35 · 854 阅读 · 0 评论 -
特征工程之分箱
转自:https://blog.youkuaiyun.com/pylady/article/details/78882220一般在建立分类模型时,需要对连续变量离散化,特征离散化后,模型会更稳定,降低了模型过拟合的风险。比如在建立申请评分卡模型时用logsitic作为基模型就需要对连续变量进行离散化,离散化通常采用分箱法。分箱的重要性及其优势离散特征的增加和减少都很容易,易于模型的快速迭代; 稀...转载 2018-08-28 15:31:18 · 1118 阅读 · 0 评论 -
python实现二分类的卡方分箱
解决的问题:1、实现了二分类的卡方分箱;2、实现了最大分组限定停止条件,和最小阈值限定停止条件;问题,还不太清楚,后续补充。1、自由度k,如何来确定,卡方阈值的自由度为 分箱数-1,显著性水平可以取10%,5%或1%算法扩展:1、卡方分箱除了用阈值来做约束条件,还可以进一步的加入分箱数约束,以及最小箱占比,坏人率约束等。2、需要实现更多分类的卡方分箱算法; 具体代码如下:...原创 2018-11-28 19:19:44 · 3602 阅读 · 1 评论