
风控模型
文章平均质量分 68
changzoe
这个作者很懒,什么都没留下…
展开
-
【模型指标】LIFT提升图
信用模型中的LIFT在模型评估中,我们常用到增益/提升(Gain/Lift)图来评估模型效果,其中的Lift是“运用该模型”和“未运用该模型”所得结果的比值。以信用评分卡模型的评分结果为例,我们通常会将打分后的样本按分数从低到高排序,取10或20等分(有同分数对应多条观测的情况,所以各组观测数未必完全相等),并对组内观测数与坏样本数进行统计。用评分卡模型捕捉到的坏客户的占比,可由该组坏样本数除以...原创 2019-04-28 18:11:57 · 12785 阅读 · 1 评论 -
【模型指标】ks,gini值,auc的关系
做风控也很久了,一直没有整理ks,gini,auc的关系,下边简单谈一下自己的理解,立下flag,以后每两天更新一篇,谈谈自己对指数的理解。先说一下ksks值和ks曲线:将所有样本根据分数值从低到高排序(即坏账率从高到低)均分成10组,分别计算这10组的实际好样本数、坏样本数、累积好样本数、累积坏样本数、累积好样本数占比、累积坏样本数占比,差值。其中实际好坏样本数分别为该组内的好坏样本数,累...原创 2019-11-06 14:45:36 · 1515 阅读 · 0 评论 -
评分卡模型——变量分箱
处理缺失:由于缺失的值都是好人,根据业务含义,服以9999m44<-train$BILL6#######处理缺失train$BILL6[is.na(m44)]=9999m44<-train$BILL6原创 2018-05-15 17:42:34 · 3009 阅读 · 0 评论 -
R smbinning包详解
做评分卡用到 整理一下smbinningOptimal Binning for Scoring Modeling 最佳分箱将数字特征归类为分数模式中的其他用途。 这个过程,也称为监督离散化,利用递归分区来将数字特征分类。 特定的算法是条件推测决策树(Conditional Inference Trees),它最初排除缺失值(NA)以计算切点,并在计算信息值的过程中稍后添加它们...原创 2018-04-04 16:16:23 · 7851 阅读 · 0 评论 -
评分卡模型-理论
评分卡模型流程 变量分群/分箱通常是为了让变量的预测力最强名义变量降低基数 类似决策树的一种算法 连续变量的分箱 在评分卡建模中,变量分箱(binning)是对连续变量离散化(discretization)的一种称呼。要将logistic模型转换为标准评分卡的形式,这一环节是必须完成的。信用评分卡开发中一般有常用的等距分段、等深分段、最...原创 2018-03-28 20:07:37 · 8747 阅读 · 1 评论 -
R做评分卡模型-实战
样本表现定义 变量含义 EDA与数据描述读入数据x<-read.csv('/Users/cc/Downloads/评分卡模型——具体举例/data1.csv',header=T,sep=',',fileEncoding = 'GBK')n <- length(x$order_id)data <- subset (x,x$BILL_CNT_L...原创 2018-04-09 10:31:33 · 1007 阅读 · 0 评论