我们选取的数据时1994年德国的一家银行在平定客户信用风险好坏的时候用到的一组变量,共有1000组数据。由于年代久远可能和实际有些出入。数据可以在下面的网址下载。 http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)
主要提供了两组数据,一份是原始数据总共有20个变量,另一分时处理过的数值数据,为了寻求更深层次的数据挖掘我们将分别利用者两组数据。
我们首先简单介绍一下变量
变量1
Status of existing checking account 现有的支票账户状态
A11 : … < 0 DM
A12 : 0 <= … < 200 DM
A13 : … >= 200 DM / salary assignments for at least 1 year
A14 : no checking account
变量2: (numerical) 数值变量(这里应该表示的是贷款期限)
Duration in month 月持续时间
变量3: (qualitative) 质量变量信用历史
Credit history 信用记录
A30 : no credits taken/ all credits paid back duly 无信用记录或所有信用都及时偿还
A31 : all credits at this bank paid back duly 这家银行的所有信用都及时偿还
A32 : existing credits paid back duly till now 直到现在有信用及时偿还
A33 : delay in paying off in the past 过去存在延迟支付
A34 : critical account/ other credits existing (not at this bank) 关键账户/在其他银行存在信用记录
变量4: (qualitative) 质量变量
Purpose 贷款目的
A40 : car (new) 新车
A41 : car (used) 旧车
A42 : furniture/equipment 家具/设备
A43 : radio/television 收音机/电视
A44 : domestic appliances 家用电器
A45 : repairs 维修
A46 : education 教育
A47 : (vacation - does not exist ) 空白—不存在
A48 : retraining 再教育
A49 : business 商业
A410 : others 其他
变量5: (numerical) 数值变量
Credit amount 信贷额度
Attibute 6: (qualitative) 质量变量
Savings account/bonds 存款
A61 : … < 100 DM
A62 : 100 <= … < 500 DM
A63 : 500 <= … < 1000 DM
A64 : .. >= 1000 DM
A65 : unknown/ no savings account 未知/无存款
变量7: (qualitative) 质量变量
Present employment since 就业状态
A71 : unemployed 失业
A72 : … < 1 year
A73 : 1 <= … < 4 years
A74 : 4 <= … < 7 years
A75 : .. >= 7 years
变量8: (numerical) 数值变量
Installment rate in percentage of disposable income 分期费率在可支配收入的百分比
变量9: (qualitative)
Personal status and sex 个人状态和性别
A91 : male : divorced/separated 男/离异/分居
A92 : female : divorced/separated/married 女/离异/分居/已婚
A93 : male : single 男/单身
A94 : male : married/widowed 男/已婚/丧偶
A95 : female : single 女/单身
变量10: (qualitative) 质量变量
Other debtors / guarantors 其他债务/担保
A101 : none 无
A102 : co-applicant 共同申请人
A103 : guarantor 担保人
变量11: (numerical)
Present residence since 目前自住宅
变量12: (qualitative)
Property 财产
A121 : real estate 房产
A122 : if not A121 : building society savings agreement/ life insurance 储蓄/
利用R语言预测银行客户信用的优劣(随机森林方法)
最新推荐文章于 2025-02-22 19:58:18 发布