一、赛题背景
以金融风控中的个人信贷为背景,要求根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款。这是一个典型的分类问题,但也涉及一些金融的业务背景知识。
二、赛题数据
赛题以预测用户贷款是否违约为任务,该数据集来自某信贷平台的贷款记录,总数据量超过120W,包含47列变量信息,其中15列为匿名变量。比赛中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时对employmentTitle、purpose、postCode和title等信息进行脱敏处理。
数据链接:https://tianchi.aliyun.com/competition/entrance/531830/information
Field | Description |
---|---|
id | 为贷款清单分配的唯一信用证标识 |
loanAmnt | 贷款金额 |
term | 贷款期限(year) |
interestRate | 贷款利率 |
installment | 分期付款金额 |
grade | 贷款等级 |
三、评测标准
提交结果为每个测试样本是1的概率,也就是y为1的概率。评价方法为AUC评估模型效果(越大越好)。意思就是每个样本判断为1的概率,一般结果为判断为0和1的概率,所以要把判断为0的概率改为判断为1的概率。
四、结果提交
提交前请确保预测结果的格式与sample_submit.csv中的格式一致,以及提交文件后缀名为csv。
形式如下:
id,isDefault
800000,0.5
800001,0.5
800002,0.5
800003,0.5
概
率
=
{
p
(
样
本
=
1
)
样
本
=
1
1
−
p
(
样
本
=
0
)
样
本
=
0
概率=\begin{cases} p(样本=1) & 样本=1 \\ 1-p(样本=0) & 样本=0 \end{cases}
概率={p(样本=1)1−p(样本=0)样本=1样本=0
比赛得分如下。
比赛代码链接:https://gitee.com/rengarwang/tianchi-game---code/tree/master/01-金融风控-贷款违约预测
有用请点个赞!!
本站所有文章均为原创,欢迎转载,请注明文章出处:https://blog.youkuaiyun.com/weixin_45092662。百度和各类采集站皆不可信,搜索请谨慎鉴别。技术类文章一般都有时效性,本人习惯不定期对自己的博文进行修正和更新,因此请访问出处以查看本文的最新版本。