基于决策树的贷款审批模型
一、背景描述
银行信贷业务是银行最基本、最重要的资产业务,通过发放银行贷款收回本金和利息,扣除成本后获得利润。银行为了获得更大的利润,对每一位顾客的信息进行分类,然后针对不同的顾客采用不同的方案。
银行每天要收到大量贷款申请,其中夹杂着大量不具备贷款资格的申请,为缓解审批人员的工作量,可以根据申请人资料,制定一个模型自动过滤高拖欠贷款概率的资格申请表。
二、数据分析
2.1.数据阅读
下表为银行贷款发放后是否拖欠的部分用户信息,其中因变量为“拖欠贷款”,自变量有“年龄”、“收入级别”、“信用卡树”、“学历”、“车贷数量”,计划通过决策树建立贷款审批模型,自动过滤高拖欠贷款概率用户。
拖欠货款 |
年龄 |
收入级别 |
信用卡数 |
学历 |
车贷数量 |
否 |
50.53 |
中 |
5张以上 |
高中 |
2次以上 |
否 |
27.02 |
高 |
少于5张 |
高中 |
无或1次 |
否 |
28.1 |
低 |
少于5张 |
高中 |
无或1次 |
是 |
24.04 |
低 |
5张以上 |
高中 |
2 |