- 博客(5)
- 收藏
- 关注
原创 零基础入门金融风控-贷款违约预测之TASK4_模型融合
针对分类问题,在简单方法中常用到投票法(Voting)。在不改变模型的情况下,直接对各个不同的模型预测结果进行投票,sklearn库中的VotingClassifier是投票法的实现。 投票法的输出有两种类型:一种是直接输出类标签,另外一种是输出类概率。使用前者进行投票为hard voting,使用后者进行分类叫做soft voting,通过voting参数进行控制。from xgboost import XGBClassifierfrom sklearn.linear_model import Log
2020-09-27 23:45:45
256
原创 零基础入门金融风控-贷款违约预测之TASK4_模型及调参
1、常用算法(1)逻辑回归算法简单,训练速度较快。在线性回归中得到一个预测值,再将该值映射到Sigmoid函数中就完成了由值到概率的转换。 自变量取值为任意实数,值域为[0,1],可将任意的输入映射到了0至1区间。(2)决策树从根节点开始一步步走到叶子节点(决策),所有的数据最终都会落到叶子节点。训练过程:首先选择根节点特征(分类的效果最好的特征),接下来应该选择什么特征,考虑如何进行特征切分,最终训练成一棵完整的树。目标即通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那
2020-09-24 23:47:53
343
原创 零基础入门金融风控-贷款违约预测之TASK3_特征工程
1、数据缺失值填充区分开数值型特征和类别型特征后用平均数填充数值型特征;用众数填充类别型特征。train[numerical]=train[numerical].fillna(train[numerical].median())train[category]=train[category].fillna(train[category].mode())2、把对象类型特征转换到数值将原来的文本类别用特定的数值代替。train["employmentLength"].value_counts(dro
2020-09-21 23:26:04
337
原创 零基础入门金融风控-贷款违约预测之TASK2_探索性数据分析EDA
1、读取文件train = pd.read_csv('train.csv')testA = pd.read_csv('testA.csv')2、基本了解train.head()这里是引用
2020-09-18 23:10:02
386
原创 零基础入门金融风控-贷款违约预测之TASK1_赛题理解
赛题以预测用户贷款是否违约为任务,根据借款人的数据信息预测其违约概率,提交结果为每个测试样本是1的概率。评价方法为AUC评估模型效果(越大越好)。赛题链接:https://tianchi.aliyun.com/competition/entrance/531830/information1、数据概况数据包含47列变量信息,其中15列为匿名变量,总数据量超过120w,为了保证比赛的公平性,将从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、p
2020-09-15 20:44:09
875
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅