- 博客(7)
- 收藏
- 关注
原创 算法进阶day3模型融合Stacking
算法进阶day3--模型融合Stacking任务Stacking代码实现结果任务用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分果。Stacking对于Stacking我也是个刚刚接触,翻看了很多材料,发现这篇文章写得比较详细,此处贴上引用地址:(https://blog.youkuaiyun.com/u011630575/article/details/81...
2019-01-09 17:31:21
935
原创 算法进阶day2特征选择
算法进阶day2--特征选择任务IV值IV值的计算代码实现IV值的计算使用随机森林进行特征选择特征合并模型的建立以及评估评分函数1、逻辑回归结果2、线性SVM结果3、决策树结果4、随机森林结果5、lightgbm结果6、xgboost结果7、GBDT结果任务分别用IV值和随机森林进行特征选择。然后分别构建模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM),进...
2019-01-07 17:33:20
788
原创 算法进阶day1
算法进阶day1任务读取数据数据分析结果数据预处理1.缺失值和异常值的处理2.数据类型转换划分数据集遇到的问题任务数据类型转换和缺失值处理(尝试不同的填充看效果)以及及其他你能借鉴的数据探索。读取数据import pandas as pdrow_data = pd.read_csv('I:\DatawhaleWeek02\Data\data.csv', encoding='GBK')...
2019-01-03 20:54:12
293
原创 算法实践第四天
算法实践第四天 任务代码实现导入包加载数据划分数据集数据标准化定义网格搜索交叉验证函数(5折)1、SVM结果2、逻辑回归结果3、随机森林结果4、随机森林结果5、GBDT结果6、xgboost结果7、Lightgbm结果任务使用网格搜索法对7个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估代码实现导入包import pandas as pdfrom sklearn.mode...
2018-12-15 17:22:46
518
1
原创 算法实践第三天
算法实践第三天 数据任务:模型评估代码实现导入包加载数据划分数据集定义得分和ROC曲线函数1.xgboost结果ROC曲线2.Lightgbm结果ROC曲线3.GBDT结果ROC曲线4.随机森林结果ROC曲线5.决策树结果ROC曲线6.线性SVM结果ROC曲线7.逻辑回归结果ROC曲线遇到的问题:数据和day01中的数据一样data_all.csv任务:模型评估记录7个模型(在Task1的...
2018-12-13 16:32:21
803
1
原创 算法实践day2
算法实践第二天 数据任务代码实现随机森林GBDTxgboostLightGBMxgboost数据和day01中的数据一样data_all.csv任务使用之前的数据data_all.csv利用随机森林、GBDT、XGBoost和LightGBM这4个模型,评分方式任意。代码实现随机森林1.导入包import pandas as pdfrom sklearn.ensemble imp...
2018-12-10 15:27:44
410
原创 算法实践第一天 ——模型构建
算法实践第一天 ——模型构建数据任务——模型构建代码实现遇到的问题数据data_all.csv文件是非原始数据,已经处理过了。数据是金融数据, 我们要做的是预测贷款用户是否会逾期。表格中, status是标签: 0表示未逾期, 1表示逾期。任务——模型构建给定数据集,数据三七分,随机种子2018。(在任务1中什么都不用考虑,即不需数据处理和模型调参)调用sklearn的包,简单构建逻辑回...
2018-12-09 10:56:41
1907
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人