
菜菜sklearn
R戎
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
skelearn 决策树及参数详解(分类一),实现红酒数据集分类
sklearn 中的决策树 1、sklearn中决策树的类都在”tree“这个模块之下。这个模块总共包含五个类: 2、sklearn建模的基本流程 这个流程中分类树对应的代码 from sklearn import tree #导入需要的模块 clf = tree.DecisionTreeClassifier() #实例化 clf = clf.fit(X_train,y_train) #用训练...原创 2019-04-11 15:01:34 · 7579 阅读 · 5 评论 -
sklearn决策树回归树详解,及波士顿房价预测,正弦曲线预测,及交叉验证实现
DecisionTreeRegressor class sklearn.tree.DecisionTreeRegressor (criterion=’mse’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=No...原创 2019-04-11 17:57:36 · 5718 阅读 · 0 评论 -
决策树sklearn实现泰坦尼克号幸存者的预测 及决策树优缺点、参数、属性、接口总结
泰坦尼克号的沉没是世界上最严重的海难事故之一,今天我们通过分类树模型来预测一下哪些人可能成为幸存者。 数据集来自https://www.kaggle.com/c/titanic,数据集包含两个csv格式文件,data为我们接下来要使用的数据,test为kaggle提供的测试集。 接下来我们就来执行我们的代码。 1. 导入所需要的库 import pandas as pd from sklearn....原创 2019-04-12 10:05:43 · 3021 阅读 · 1 评论 -
sklearn随机森林-分类参数详解
sklearn中的集成算法 1、sklearn中的集成算法模块ensemble ensemble.AdaBoostClassifier : AdaBoost分类 ensemble.AdaBoostRegressor :Adaboost回归 ensemble.BaggingClassifier :装袋分类器 ensemble.BaggingRegressor :装袋回归器 ensem...原创 2019-04-12 20:58:04 · 39891 阅读 · 5 评论 -
sklearn逻辑回归参数详解,及用逻辑回归制作评分卡
1 导库,获取数据 %matplotlib inline import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression as LR #其实日常在导库的时候,并不是一次性能够知道我们要用的所有库的。通常都是在建模过程中逐渐导入需要的库。 data = pd.read_csv(r"...原创 2019-04-16 11:11:18 · 4803 阅读 · 7 评论 -
sklearn 随机森林参数属性接口及 在乳腺癌数据上的调参
1. 导入需要的库 from sklearn.datasets import load_breast_cancer from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import GridSearchCV from sklearn.model_selection import cross...原创 2019-04-14 22:12:33 · 1103 阅读 · 0 评论 -
sklearn 数据处理与特征工程
1、数据处理的流程 2 数据预处理 Preprocessing & Impute 2.1 数据无量纲化 在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中,譬如逻辑回归,支持向量机,神经网络,无量纲化可以加快求解速度;而在距离类模型,譬如K近邻,K-Means聚类中,无...原创 2019-04-14 23:00:16 · 2135 阅读 · 1 评论