
数据挖掘项目
ZoeHwang_
不务正业的程序员
知乎:ZoeHuang
B站:ZoeHwang_
微信公众号:ZoeHwang
展开
-
Task1.2 模型构建之集成模型
构建随机森林、GBDT、XGBoost和LightGBM这4个模型,并对每一个模型进行评分# install the package in jupyter notebook!pip install xgboost!pip install lightgbmimport pandas as pdimport numpy as npfrom sklearn.model_selection ...原创 2018-12-20 11:16:07 · 313 阅读 · 0 评论 -
Task2 模型评估
记录7个模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。(时间太紧了直接上代码了嘤嘤)import pandas as pdimport numpy as npfrom sklearn.model_selection import train...原创 2018-12-22 14:35:52 · 275 阅读 · 0 评论 -
预测贷款用户是否会逾期
数据信息:这是本次实践数据的下载地址 https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g说明:这份数据集是金融数据(非原始数据,已经处理过了),要做的是预测贷款用户是否会逾期。表格中 “status” 是结果标签:0表示未逾期,1表示逾期。任务1.1 - 模型构建将金融数据集三七分随机种子2018调用sklearn的包,简单构建逻辑回归、S...原创 2018-12-18 20:25:33 · 1531 阅读 · 0 评论 -
Task3 模型调优
使用网格搜索法对7个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估import pandas as pdimport numpy as npfrom sklearn.model_selection import GridSearchCVfrom sklearn.model_selection import train_test_splitfrom sklearn.svm i...原创 2018-12-24 21:48:36 · 234 阅读 · 0 评论 -
金融贷款预测
数据预处理说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 “status” 是结果标签:0表示未逾期,1表示逾期。import pandas as pdfrom sklearn.model_selection import train_test_splitfinancial = pd.read_csv("data.csv", encod...原创 2019-01-04 21:52:27 · 911 阅读 · 0 评论 -
金融贷款
任务:分别用IV值和随机森林进行特征选择。然后分别构建模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM),进行模型评估。用IV值进行特征选择:import pandas as pdfrom pandas import DataFrame as dffrom numpy import logimport numpy as npfinancial = ...原创 2019-01-07 21:59:21 · 490 阅读 · 0 评论 -
金融预测
一周算法实践进阶day3:模型融合import pandas as pdfrom sklearn.model_selection import train_test_splitimport numpy as npfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import Logistic...原创 2019-01-09 21:29:47 · 632 阅读 · 0 评论