
sklearn
文章平均质量分 93
cxykk1217
这个作者很懒,什么都没留下…
展开
-
Sklearn学习笔记一 :k-近邻算法
中文文档地址KNneighborsClassifier参数说明:n_neighbors:默认为5,就是k-NN的k的值,选取最近的k个点。weights:默认是uniform,参数可以是uniform、distance,也可以是用户自己定义的函数。uniform是均等的权重,就说所有的邻近点的权重都是相等的。distance是不均等的权重,距离近的点比距离远的点的影响大。用户自定义的函数,接收距离...原创 2018-05-22 20:27:00 · 1790 阅读 · 1 评论 -
Sklearn学习笔记二 :PCA
中文文档地址2.5.1. 主成分分析(PCA)¶2.5.1.1. 准确的PCA和概率解释(Exact PCA and probabilistic interpretation)PCA 用于对一组连续正交分量中的多变量数据集进行方差最大方向的分解。在 scikit-learn 中, PCA 被实现为一个变换对象, 通过 fit 方法可以降维成 n 个成分,并且可以将新的数据投影(project, 亦...原创 2018-05-24 16:28:17 · 8333 阅读 · 1 评论 -
sklearn学习笔记 三 集成方法AdaBoost
官方英文文档手册http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.htmlsklearn.ensemble模块提供了很多集成方法,AdaBoost、Bagging、随机森林等。本文使用的是AdaBoostClassifier。AdaBoostClassifier这个函数,一共有5...原创 2018-05-30 21:15:39 · 3615 阅读 · 0 评论 -
Sklearn-GridSearchCV网格搜索
GridSearchCV官方网址:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.htmlGridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。这个时候就是需要动脑...原创 2018-09-19 11:08:28 · 675 阅读 · 0 评论 -
sklearn:随机森林
官方文档地址:http://sklearn.apachecn.org/cn/0.19.0/modules/ensemble.html#id8分类:class sklearn.ensemble.RandomForestClassifier(n_estimators=10, criterion='gini', max_depth=None, min_samples_split=2, min_...原创 2018-09-20 15:46:12 · 918 阅读 · 2 评论 -
sklearn :Xgboost
1. XGBoost的优势XGBoost算法可以给预测模型带来能力的提升。当我对它的表现有更多了解的时候,当我对它的高准确率背后的原理有更多了解的时候,我发现它具有很多优势:1.1 正则化标准GBM的实现没有像XGBoost这样的正则化步骤。正则化对减少过拟合也是有帮助的。 实际上,XGBoost以“正则化提升(regularized boosting)”技术而闻名。1.2 并行处...原创 2018-09-20 16:34:29 · 1556 阅读 · 0 评论 -
scikit-learn决策树算法
scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier,而回归决策树的类对应的是DecisionTreeRegressor。两者的参数定义几乎完全相同,但是意义不全相同。下面就对DecisionTreeClassifier和DecisionTreeRegressor的重要参数...原创 2022-05-28 17:23:01 · 390 阅读 · 0 评论 -
sklearn:GBDT调参
官方文档:文档1. scikit-learn GBDT类库概述 在sacikit-learn中,GradientBoostingClassifier为GBDT的分类类, 而GradientBoostingRegressor为GBDT的回归类。两者的参数类型完全相同,当然有些参数比如损失函数loss的可选择项并不相同。这些参数中,类似于Adaboost,我们把重要参数分为两类,第一...原创 2018-10-23 15:37:30 · 2040 阅读 · 0 评论