今日分享:中原银行「个贷违约预测」赛题二等奖获奖方案
赛题链接:https://www.datafountain.cn/competitions/530

团队简介
获奖团队:番禺吴彦祖
我们团队是来自华南理工19软件工程2班的同班同学,虽然我们性格各异,喜好也有所不同,但平时在一起却很合拍,学习、娱乐都形影不离。这次的比赛给了我们一个能够一起学习,一起进步的机会,虽然中间遇到种种挫折,但我们通过合理的分工、有效的沟通、成员之间取长补短,耐心努力地去克服一切困难,并最终战胜了它们。我们是一支有实力队伍,我们年经、充满活力,为了心目中那份梦想而努力追逐,持之以恒,哪怕遇见再大的风险、再大的浪,相信我们也会有默契的目光。我们队伍名称是番禺吴彦祖,相信我们永远帅气。
摘要
为进一步促进金融普惠的推广落地,金融机构需要服务许多新的客群。银行作为对风险控制要求很高的行业,因为缺乏对新客群的了解,对新的细分客群的风控处理往往成为金融普惠的重要阻碍。本文利用已有的与目标客群稍有差异的另一批信贷数据,通过迁移学习捕捉不同业务中用户基本信息与违约行为之间的关联,解决了目标客户群信息量过少的问题 。同时,利用数据量巨大的那批信贷数据,通过多层数据增强,以及和金融领域相关的知识构建更具有代表性的特征,大大提升了对用户违约预测的准确率。
关键词
迁移学习、数据增强、特称工程
数据预处理和特征工程进行数据增强
赛题主办方为我们提供train_public内部数据训练集和train_internet外部数据训练集以及test_public测试集,先对数据进行分析。
数据预处理
通过查看train_public数据信息,共10000条39个不同属性,我们做了如下预处理:

华南理工团队荣获二等奖,通过迁移学习处理新客群信息不足,结合数据增强和金融领域知识,构建特征并优化CatBoost模型,提升违约预测精度。
最低0.47元/天 解锁文章
1358

被折叠的 条评论
为什么被折叠?



