
sas评分卡模型
文章平均质量分 75
jin_tmac
这个作者很懒,什么都没留下…
展开
-
风控模型常见问题
1.数据驱动型金融场景下,风控模型的种类有哪些?获客阶段:用户响应模型,风险预筛选模型授信阶段:申请评分模型,反欺诈模型,风险定价模型,收益评分模型贷中阶段:行为评分模型,交易欺诈模型,客户流失模型贷后阶段:预催收模型,早期催收模型,晚期催收模型2.简单描述一些风控建模的流程?前期准备工作阶段:不同的模型针对不同的业务场景,在建模项目开始前需要对业务的逻辑和需求有清晰的理解,明确模型的业务目标和作用,项目周期时间和安排进度,以及模型效果的要求。模型设计阶段:包括模型的选择(评分卡亦或是集成转载 2021-10-26 10:25:23 · 847 阅读 · 0 评论 -
Python变量分箱--woe值单调分箱
最近上传了一个变量分箱的方法到pypi,这个包的主要有以下说明:缺失值单独一箱,不论缺失的数量多少;生成的分箱woe值是单调的,后续有时间会迭代U型分箱的版本;会有分箱最小样本数占比,类似决策树的最小叶节点占比;分箱成功的变量才会保留,有可能失败的情况是找不出同时满足上述2和3的分箱;具体的变量分箱原理见之前的博客。可以通过pip install woe-linear-bin 安装...原创 2019-10-28 14:15:06 · 7616 阅读 · 11 评论 -
sas构建评分卡模型过程详解(二):变量筛选及逻辑回归
上一篇已经将所有变量都转化为woe值的形式,这里再另外补充一个小技巧—dummy变量的使用。 1.有时候我们的数据来源可能不是很真实,如客户自己填写的婚姻状况,假设婚姻状况不会要求客户提供证明,但此时我们想加入这个变量,可以考虑加入”是否未婚或者离异”,此时认为客户填写未婚或者离异的相比填写已婚的较为真实。 2.在上一篇连续变量分箱分箱时有说到,当变量是U型时强行改变变量的趋势可原创 2018-01-03 14:20:50 · 10804 阅读 · 0 评论 -
sas构建评分卡模型过程详解(一):特征处理及变量分箱
在进行特征处理前首先要走的是数据的导入和清洗,这里不再赘述。特征工程包括:缺失值、变量同质性、变量分箱。 下面来逐一说明:缺失值:包括变量收集时缺失、变量加工时缺失。建模过程中如请求第三方数据时无法查得,前端人员填入错误等都认为是变量收集时的缺失;变量加工时的缺失可能是数据处理人员在加工数据时使用的一些筛选语句造成。处理方法:首先检查操作失误的变量,如汇总数据设置为0、占比类分母...原创 2018-01-02 10:37:42 · 15636 阅读 · 1 评论 -
sas构建评分卡模型过程详解(三):变量分箱及特征筛选补充
在sas构建评分卡系列一已经对变量分箱在保证woe的单调作了补充sas构建评分卡模型过程详解(一):特征处理及变量分箱 我们希望的好的分箱是这样子的: 但是如果加单调限制的iv相比不加单调限制的iv差别不小,或者有的变量在有跳点的情况下也符合业务需求,这时处于中间的风险低于或者高于两侧的风险。 如: 但我们通常也不希望跳点多于1个,像下面这样子: 因此,可以实现挑选出最多只有...原创 2018-03-28 14:45:15 · 6980 阅读 · 0 评论 -
sas 提升图与sgplot过程
一、提升图:在我们模型完成之后,还要看模型的提升图,主要是通过随机选择比较模型。通俗点就是将模型预测的违约概率降序排列,按照样本数分成10等分,计算出每一等分上的坏样本占比badrate,和随机抽样即总样本的badrate对比,就是提升图。如下图所示: 好的模型提升图应该是光滑的向下的曲线,最好有3到4个点是在random的上方。二、sgplot过程:可视化从来都不是一两...原创 2018-06-06 13:36:02 · 7236 阅读 · 0 评论 -
logistic regression--sas逐步回归推导验证
1、逻辑回归定义事件发生的概率为 其中: 因此对于输入x分类结果为类别1和类别0的概率分别为: (1)式综合起来可以写成: 取似然函数为: 对数似然函数为: 实际求解中通常取 -2log L 求解变量系数就是使用梯度下降法求 -2log L 的最小值,sas logistic 采用牛顿法 和Fisher scoring法(默认)。先说几个概念1、似...原创 2018-06-12 19:01:38 · 6712 阅读 · 1 评论 -
特征筛选(变量聚类proc varclus)
在模型筛选变量的时候,我们可以用varclus进行变量聚类分析来进行降维。提到降维我们会首先想到主成分分析,主成分实际上是正交主成分。而varclus是斜交主成分,其是在正交主成分的基础上再做了一些旋转。这样得到的主成分不仅能保留主成分的优点(主成分变量相关程度比较低)。另外一方面又能有很到的解释性,并且能达到对变量聚类的效果。综合说来就是,主成分分析是生成了新的主成分变量,用原始变量的线性关系...原创 2019-02-18 18:53:19 · 11104 阅读 · 4 评论 -
模型监控中的应用--Excel动态图表和VBA
在监控模型变量的有效性和稳定性时需要看woe变化以及iv变化,可以做成下面的动态图表,可以同时选择变量以及监控的指标。方法如下:准备数据:然后,插入数据透视表,行添加为‘state_date’,列添加为‘var_clus’,考察指标设置为求和项,注意:var_name此时不添加,对透视表添加‘切片器’,将var_name勾选。最后,对透视表插入折线图,并在当前sheet添加如下宏代码。...原创 2019-02-19 14:29:57 · 1475 阅读 · 0 评论