Home Credit Default Risk(1) — 背景介绍

最新推荐文章于 2022-05-19 20:47:18 发布

原创

最新推荐文章于 2022-05-19 20:47:18 发布 · 4.7k 阅读

20 ·

CC 4.0 BY-SA版权

本文介绍了Home Credit Default Risk竞赛的背景，该竞赛源于Home Credit公司的信贷风险评估。文章对比了Home Credit与支付宝的商业模式，并详细解释了公司如何通过Point-of-sale loans和Credit cards建立信用体系。主要内容包括数据文件的描述，如bureau.csv、bureau_balance.csv、POS_CASH_balance.csv、credit_card_balance.csv，以及application_{train|test}.csv字段的含义，强调理解业务对数据分析的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

总体介绍

Home Credit Default Risk是Home Credit公司在kaggle上的一个信贷风险评估竞赛。其提供的数据文件描述及文件间关联关系如下：在这里插入图片描述
有些金融专有名词尤其是一些公司产品的专有名词对于我们外行人员来说相当难理解了，所以我查看了下公司官网，给出了一些背景介绍，有助于理解数据吧。
Home Credit公司的商业模式其实跟支付宝的某些部分很像，后面会类比。一个信用贷款公司的为一个在本公司没有信用记录的用户提供信用贷款是有很大风险的，当然一般冷启动的做法可以是查询用户在信用局的历史征信记录来作为风险评估的参考，数据文件中的bureau.csv和 bureau_balance.csv 就对应这部分数据
此外信用贷款公司还需要逐步引导用户使用自己公司的金融产品，来建立自己的信用体系。Home Credit公司的产品也是循序渐进的，其中Point-of-sale (POS) loans就是一款入门级产品，对于一些价值不高的零售业商品（预计普通人都能承受起的商品），引导用户通过该产品分期付款，从而建立初步的信用数据，这么说起来就很像我们常用的支付宝的花呗功能了，POS_CASH_balance.csv 中的数据就来源于此。该产品体系图如下：在这里插入图片描述
在此基础上衍生出的进阶产品就有Credit cards，可以理解为信用贷款吧，类似于支付宝的借呗 功能，用户使用该产品产生的信用记录就对应于credit_card_balance.csv 中的数据。