
数据处理
Guoliang Li
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据竞赛-模型选择
from __future__ import print_function import lightgbm as lgb import sklearn import numpy import hyperopt from hyperopt import hp, fmin, tpe, STATUS_OK, Trials import colorama import numpy as np N_HYP...原创 2020-01-15 20:47:18 · 249 阅读 · 0 评论 -
T1.1模型构建,预测贷款用户是否会逾期
【数据集下载】 本次实践数据的下载地址 https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g 说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 “status” 是结果标签:0表示未逾期,1表示逾期。 【任务1.1 - 模型构建】 将金融数据集三七分,随机种子2018,调用sklearn包,简单构建逻辑回归...原创 2019-01-03 20:07:21 · 918 阅读 · 1 评论 -
T1.2 - 模型构建之集成模型,预测贷款用户是否会逾期
【任务1.2 - 模型构建之集成模型】 说明:对上一篇Task1.1模型构建,预测贷款用户是否会逾期代码的补充,需在上一篇代码之后运行 构建随机森林、GBDT、XGBoost和LightGBM这4个模型,并对每一个模型进行评分,评分方式任意,例如准确度和auc值。 必须有 的2关键点:4个模型和对应的评分结果 模型构建 #导入库 from sklearn.ensemble import Rando...原创 2019-01-05 21:07:34 · 396 阅读 · 0 评论 -
T3 模型评估
说明:对前面Task1.1模型构建,预测贷款用户是否会逾期代码的补充,需在上一篇代码之后运行 记录7个模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。 必须有 的5关键点:7个模型的accuracy、precision,recall和F1-score...原创 2019-01-06 01:26:32 · 529 阅读 · 0 评论 -
【T4 - 模型调优】
任务4 - 模型调优 使用网格搜索法对7个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估,记得展示代码的运行结果~ 网格搜索https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html 参数不会用,用多了又跑不动,参考的算法实践1.4模型调优 还没写完,后面补上 ...原创 2019-01-09 21:55:34 · 275 阅读 · 0 评论 -
单变量线性回归-code
目录1、导入库2、随机生成数据3、算术法梯度下降法4、向量法(即直接调用函数)4.1、拆分训练集和测试集4.2、得出线性回归方程5、算术法与向量法比较 1、导入库 import numpy as np import matplotlib.pyplot as plt from pandas import DataFrame,Series from sklearn.model_selection im...原创 2019-03-02 21:10:49 · 926 阅读 · 0 评论