
SKLEARN
文章平均质量分 67
我是个菜鸡.
任何想去的地方,都没有捷径。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
SKLEARN-4
SKLEARN数据预处理、特征选择feature_selection原创 2022-02-11 20:38:14 · 1067 阅读 · 0 评论 -
SKLEARN实例:【随机森林在乳腺癌数据上的调参】
目录步骤1.导入需要的库2. 导入数据集,探索数据3. 进行一次简单的建模,看看模型本身在数据集上的效果4. 随机森林调整的第一步:无论如何先来调n_estimators5. 在确定好的范围内,进一步细化学习曲线6.利用网格搜索,按照参数对模型整体准确率的影响程度进行调参,首先调整max_depth7.调整max_features8.调整min_samples_leaf9.调整min_samples_split完整代码步骤1.导入需要的库from sklearn.datasets import loa原创 2022-02-06 15:16:09 · 2321 阅读 · 0 评论 -
SKLEARN实例:【用随机森林回归填补缺失值】
目录1.使用均值或0填充缺失值2.使用随机森林填补缺失值1.使用均值或0填充缺失值2.使用随机森林填补缺失值对于一个有n个特征的数据来说,其中特征T有缺失值,我们就把特征T当作标签,其他的n-1个特征和原本的标签组成新的特征矩阵。那对于T来说,它没有缺失的部分,就是我们的Y_train,这部分数据既有标签也有特征,而它缺失的部分,只有特征没有标签,就是我们需要预测的部分。特征T不缺失的值对应的其他n-1个特征+本来的标签:x_train特征T不缺失的值: Y_train特征T缺失的值对应的其原创 2022-02-02 21:44:03 · 2208 阅读 · 0 评论 -
SKLEARN-3-随机森林
随机森林目录1.基本步骤1.1 参数n_estimators1.2 建立森林1.3 n_estimators的学习曲线2.标签和特征1.基本步骤#基本建模流程#1.实例化#2.训练集带入实例化后的模型去进行训练,使用的接口是fit#3.使用其它接口将测试集导入我们训练好的模型,去获取我们希望获取的结果(score,Y_test)1.1 参数n_estimators这是森林中树木的数量,即基基评估器的数量。这个参数对随机森林模型的精确性影响是单调的,n_estimators越大,模型原创 2022-01-24 15:39:44 · 2524 阅读 · 0 评论 -
SKLEARN实例:【泰坦尼克号生存者预测】
原创 2022-01-21 19:33:46 · 788 阅读 · 0 评论 -
Python小知识
目录numpy库中的mean()函数pandas填充缺失值dropna()删除缺失行info()head() 展示Pandas中的unique()numpy tolist()的用法lambda 函数是一种小的匿名函数astypeloc和ilocdata.columns展示列名numpy库中的mean()函数求平均值pandas填充缺失值data[“age”].fillna(data[‘age’].mean()) 把age为缺失值的填充上平均值dropna()删除缺失行data.dropna()原创 2022-01-21 13:55:53 · 2947 阅读 · 0 评论 -
SKLEARN-2 回归树
回归树目录1.重要的参数、属性、接口criterion2. 交叉验证3.一维回归的图像绘制1.导入库2.噪声曲线2.1.2 实现一棵树,随机性参数1. 决策树及建模基本流程目标:将表格转化成一棵树2.DecisionTreeClassifier观察参数2.1 重要参数2.1.1 criterion(尺度;标准)为了要将表格转化为一棵树,决策树需要找出最佳节点和最佳的分枝方法,对分类树来说,衡量这个"最佳"的指标叫做’不纯度’。 通常来说,不纯度越低,决原创 2021-11-26 19:39:42 · 2114 阅读 · 0 评论