
搭建金融信贷中的机器学习模型
文章平均质量分 95
评分卡,预处理与特征构建,模型的监控与调优等
写SQL的菜鸟
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
模型评价指标(混淆矩阵,AUC,ROC)
模型的预测性: 正例覆盖率:表示正确预测的正例数在实际正例数中的比例,即Sensitivity,也叫 Recall=TPTP+FNRecall=\frac{TP}{TP+FN}Recall=TP+FNTP,所有真正违约的样本中,能被模型检测出来的比例。 负例覆盖率:表示正确预测的负例数在实际负例数中的比例,Specificity=TNTN+FPSpecificity=\frac{TN}{TN+FP}Specificity=TN+FPTN AUC曲线:x轴为1-specificity,即负例错判率;y轴原创 2021-10-30 07:44:40 · 889 阅读 · 0 评论 -
申请评分卡
一、数据的预处理与特征构建 简介:在构建评分卡模型的工作中,数据预处理工作和特征构建工作是至关重要的一步。数据的预处理工作可以有效处理缺失值与异常值,从而增强模型的稳健性。而特征构建工作则可以将信息从字段中加以提炼,形成有业务含义的优异特征。 1.评分卡简介: 风控场景中的评分卡:1)以分数的形式来衡量风险几率的一种手段;2)是对未来一段时间内违约/逾期/失联概率的预测;3)有一个明确的(正)区间;4)通常分数越高越安全;5)数据驱动;6)反欺诈评分卡、申请评分卡、行为评分卡、催收评分卡。 申请评分卡(Ap原创 2021-05-08 17:46:03 · 1617 阅读 · 0 评论 -
第四章 数据的预处理与特征构建(续)
申请评分卡模型 数据的预处理与特征构建(续) 课程简介:逻辑回归模型的特征需要是数值型,因此类别型变量不能直接放入模型中去,需要对其进行编码。此外,为了获取评分模型的稳定性,建模时需要对数值型特征做分箱的处理。最终在带入模型之前,我们还需要对特征做单变量与多变量分析的工作。 目录: 特征的分箱 WOE与特征信息值 单变量分析与多变量分析 特征的分箱...原创 2020-05-26 14:50:00 · 887 阅读 · 0 评论 -
第九章 组合模型在信贷风控中的应用
组合模型在信贷风控中的应用 简介:在包括违约预测在内的诸多场景中,越来越多的建模人员将模型集成的方式应用在实际工作中,并且取得了不错的成效。本节课将介绍三种基本的集成方式:Bagging,boosting,stacking。 目录: 1.元模型与集成模型 2.多模型的bagging 3.多模型的boosting 4.多模型的stacking 1.元模型与集成模型 什么是集成模型:把多种单...原创 2020-05-31 09:18:00 · 256 阅读 · 0 评论 -
第六章 模型的验证、监控与调优
模型的验证、监控与调优 简介:得到评分卡模型后,还需要验证模型的性能。并且部署后还要持续监测模型的表现。 目录: 模型的区分度 模型的预测性与混淆矩阵 模型的平稳性 模型的调优 模型的区分度 区分度的概念 评分模型的作用是通过分数将好坏人群进行区分。从分数的性质可以看出,好的评分模型下违约人群的分数低、非违约人群的分数高。反之坏的评分模型下违约与非违约人群的分数是几乎无法区分的。在理想模...原创 2020-05-27 16:40:00 · 822 阅读 · 0 评论 -
第五章 逻辑回归模型在评分卡开发中的应用
逻辑回归模型在评分卡开发中的应用 课程简介:在分类场景中,逻辑回归模型是常用的一类算法。它具有结构简单、可解释性强、输出结果是"软分类"的特点。评分模型多采用这类算法。同时逻辑回归模型也面临一些限制,因此在特征工程阶段我们对输入特征做了相应的调整和约束。 目录: 逻辑回归模型的基本概念 基于逻辑回归模型的评分卡构建工作 尺度化 1. 逻辑回归模型的基本概念 伯努利概型 在分类模型中,目标...原创 2020-05-26 16:13:00 · 622 阅读 · 1 评论