常用风险因子
静态信息:
客户持有的产品数量、种类
客户的年龄、性别
客户所处地理 位置
产品类别
动态信息:
交易的间隔时间
营销、促销手段
银行的服务方式和态度
单因子分析之连续变量
1、有效记录占比
2、整体分布
初始分布
截断分布
3、按目标变量分布的差异
方差分析,用于两个及以上类别的均值差异的显著性检验,可以查看各个不同类别是否属于同一分布
用到的是F分布,F=MSTR-MSE,分子自由度为n-1,分子自由度为n-k,n为样本总数,k为样本群数量
例如:判断男生的工资与女生的工资是否分布相同,k就等于2,n等于男生工资观测数加女生工资观测数目
MSTR为组间方差
MSE为组内方差
单因子分析之类别变量
1、有效记录占比
2、种类
3、整体分布
4、按目标变量分布的差异
差异的量化:
卡方检验:用来衡量两个分类变量的独立性
多因子分析
连续型变量相关性分析