二等奖方案|2021 CCF BDCI个贷违约预测赛题@番禺吴彦祖 队解题思路

华南理工团队荣获二等奖,通过迁移学习处理新客群信息不足,结合数据增强和金融领域知识,构建特征并优化CatBoost模型,提升违约预测精度。

今日分享:中原银行「个贷违约预测」赛题二等奖获奖方案

赛题链接:https://www.datafountain.cn/competitions/530

 

团队简介

获奖团队:番禺吴彦祖

我们团队是来自华南理工19软件工程2班的同班同学,虽然我们性格各异,喜好也有所不同,但平时在一起却很合拍,学习、娱乐都形影不离。这次的比赛给了我们一个能够一起学习,一起进步的机会,虽然中间遇到种种挫折,但我们通过合理的分工、有效的沟通、成员之间取长补短,耐心努力地去克服一切困难,并最终战胜了它们。我们是一支有实力队伍,我们年经、充满活力,为了心目中那份梦想而努力追逐,持之以恒,哪怕遇见再大的风险、再大的浪,相信我们也会有默契的目光。我们队伍名称是番禺吴彦祖,相信我们永远帅气。

摘要

为进一步促进金融普惠的推广落地,金融机构需要服务许多新的客群。银行作为对风险控制要求很高的行业,因为缺乏对新客群的了解,对新的细分客群的风控处理往往成为金融普惠的重要阻碍。本文利用已有的与目标客群稍有差异的另一批信贷数据,通过迁移学习捕捉不同业务中用户基本信息与违约行为之间的关联,解决了目标客户群信息量过少的问题 。同时,利用数据量巨大的那批信贷数据,通过多层数据增强,以及和金融领域相关的知识构建更具有代表性的特征,大大提升了对用户违约预测的准确率。

关键词

迁移学习、数据增强、特称工程

数据预处理和特征工程进行数据增强

赛题主办方为我们提供train_public内部数据训练集和train_internet外部数据训练集以及test_public测试集,先对数据进行分析。

数据预处理

通过查看train_public数据信息,共10000条39个不同属性,我们做了如下预处理:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值