
机器学习_sklearn
MemoryLix
这个作者很懒,什么都没留下…
展开
-
scikit-learn中随机森林使用详解(参数,属性和方法)
scikit-learn中和随机森林算法相关的类为RangeForestClassifier,这个类的主要参数和方法如下:类的构造函数为:RandomForestClassifier(n_estimators=10,criterion=’gini’, max_depth=None,min_samples_split=2,min_samples_leaf=1,min_weight_frac...原创 2018-07-04 23:44:33 · 13760 阅读 · 5 评论 -
sklearn.preprocessing(数据预处理方法及选择)
预处理—sklearn.preprocessing1.Standardization标准化Note:标准化是针对每一列而言的概念:Standardization标准化是将特征数据的分布调整成标准正太分布,也叫高斯分布,也就是使得数据的均值维0,方差为1.原因: 如果有些特征的方差过大,则会主导目标函数从而使参数估计器无法正确地去学习其他特征。过程为两步:去均值的中心...原创 2018-07-04 23:33:54 · 1358 阅读 · 0 评论