
机器学习
文章平均质量分 85
阿尔卑斯糖
这个作者很懒,什么都没留下…
展开
-
GBDT算法原理个人总结
0.前言本文仅仅是自己的学习总结,好记性不如烂笔头,可能会与其他博客有很多相似的地方,如若侵权,立删。1.提升树原创 2021-06-17 21:07:03 · 539 阅读 · 0 评论 -
天猫重复购买用户预测数据集
天池大赛-天猫重复购买用户预测数据集链接:https://pan.baidu.com/s/1l08kzFk_ttGUAptvoyQLig提取码:pd98如若侵权,立删原创 2020-12-30 11:00:54 · 1955 阅读 · 1 评论 -
机器学习模型基本参数调整方法
注:本文主要方便自己查阅,如有问题欢迎留言模型默认的参数有时并不是最优的参数,为了寻找最优的参数,在这里使用RandomizedSearchCV和GridSearchCV.1 RandomizedSearchCVRandomizedSearchCV函数可以帮助我们在候选集组合中,不断的随机选择一组合适的参数来建模,并且求其交叉验证后的评估结果。如果按照每个参数进行遍历,那么计算量将非常的大,假设模型有5个参数待定,每个参数都有10种候选值,这将是一个巨大的数据量,几小时能完成一次建模就已经不错.原创 2020-08-30 16:34:44 · 2459 阅读 · 0 评论 -
决策树可视化
决策树可视化方法from sklearn.model_selection import train_test_splitfrom sklearn.datasets.california_housing import fetch_california_housingimport pydotplusfrom IPython.display import Imagehousing = fetch_california_housing()# 数据集划分data_train, data_test原创 2020-08-14 19:33:54 · 2321 阅读 · 0 评论