二等奖方案|2021 CCF BDCI个贷违约预测赛题@番禺吴彦祖队解题思路

最新推荐文章于 2024-12-08 16:16:15 发布

原创

最新推荐文章于 2024-12-08 16:16:15 发布 · 887 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #机器学习 #数据挖掘

华南理工团队荣获二等奖，通过迁移学习处理新客群信息不足，结合数据增强和金融领域知识，构建特征并优化CatBoost模型，提升违约预测精度。

今日分享：中原银行「个贷违约预测」赛题二等奖获奖方案

赛题链接：https://www.datafountain.cn/competitions/530

团队简介

获奖团队：番禺吴彦祖

我们团队是来自华南理工19软件工程2班的同班同学，虽然我们性格各异，喜好也有所不同，但平时在一起却很合拍，学习、娱乐都形影不离。这次的比赛给了我们一个能够一起学习，一起进步的机会，虽然中间遇到种种挫折，但我们通过合理的分工、有效的沟通、成员之间取长补短，耐心努力地去克服一切困难，并最终战胜了它们。我们是一支有实力队伍，我们年经、充满活力，为了心目中那份梦想而努力追逐，持之以恒，哪怕遇见再大的风险、再大的浪，相信我们也会有默契的目光。我们队伍名称是番禺吴彦祖，相信我们永远帅气。

摘要

为进一步促进金融普惠的推广落地，金融机构需要服务许多新的客群。银行作为对风险控制要求很高的行业，因为缺乏对新客群的了解，对新的细分客群的风控处理往往成为金融普惠的重要阻碍。本文利用已有的与目标客群稍有差异的另一批信贷数据，通过迁移学习捕捉不同业务中用户基本信息与违约行为之间的关联，解决了目标客户群信息量过少的问题。同时，利用数据量巨大的那批信贷数据，通过多层数据增强，以及和金融领域相关的知识构建更具有代表性的特征，大大提升了对用户违约预测的准确率。

关键词

迁移学习、数据增强、特称工程

数据预处理和特征工程进行数据增强

赛题主办方为我们提供train_public内部数据训练集和train_internet外部数据训练集以及test_public测试集，先对数据进行分析。

数据预处理

通过查看train_public数据信息，共10000条39个不同属性，我们做了如下预处理：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。