
大数据与建模
文章平均质量分 82
金科应用研院
关注公众号「金科应用研院」回复“csdn”可获得量化风控学习资料包
展开
-
LR和XGB在风控模型中的对比
信贷风控模型是银行等金融机构在贷款业务中必备的风控手段之一,它通过对借款人的个人信息、资产状况、还款历史等多个方面进行综合评估,来预测借款人是否具有还款能力和还款意愿。在实际应用中,信贷风控模型需要基于大量的数据和复杂的算法模型进行训练和优化,以提高预测的准确性和稳定性。传统的风控建模大多采用逻辑回归(LR)的算法,而近年来,随着对于模型精度要求的不断提高,一些更加先进复杂的机器学习算法也开始被引入到风控模型中,其中又以XGBOOST最具代表性。原创 2023-04-21 15:41:37 · 959 阅读 · 1 评论 -
三方数据的评估分析
随着社会发展的越来越快,各种各样的数据越来越多,那么怎么能从如此庞大的数据源中去寻找合适的数据去为风控服务呢,接下来分享一些对三方数据的进行评估和监测的方法。关注“金科应用研院”,回复“优快云”领取“风控资料合集”原创 2022-10-25 09:00:00 · 542 阅读 · 0 评论 -
“策略+模型“评级流程详析(含数据字典)
前面两篇系列干货文章当中,小篇跟大家介绍了决策矩阵的场景及解决方案、原理与架构、如果没有看过文章的小伙伴可以点击下方链接回顾下精彩内容。带着这个逻辑,结合案例样本数据,我们来进一步探讨下矩阵中与策略、模型相关的分析。原创 2022-10-20 09:00:00 · 593 阅读 · 0 评论 -
基于Toad的评分卡模型全流程详解(内含代码)
至此,我们就用toad快速完成了一个评分卡模型的全流程,可以说是非常方便了,没有使用太多第三方库,除了基本的numpy,pandas就只用到了toad和一点点sklearn,这也可以看出toad确实将评分卡的全流程都进行了完整的封装,足以满足大部分工作的需求。toad是针对风险评分卡的建模而开发的工具包,其功能全面,性能强大,从数据探索EDA、特征筛选、特征分箱、WOE变换,到建模、模型评估、转换分数,对评分卡模型的各个步骤都做了完整的封装,极大的简化了建模的复杂程度,深受从业人员的喜爱。原创 2022-10-12 17:18:38 · 4844 阅读 · 3 评论 -
异常点检测的应用场景与检测方法(含代码实操案例)
这里常说的异常点,目前并没有具体的严格定义,大多数来讲,检测异常点都是按照数据分布与业务逻辑结合进行主观判断是否属于异常点。原创 2022-09-02 11:30:17 · 1806 阅读 · 0 评论 -
做策略分析,怎么能不懂用户画像、用户分群、用户分层?
1、决策树,是一种分类算法和回归算法,一个类似于流程图的树形结构,树内部的每一个节点代表的是对一个特征的测试,树的分支代表该特征的每一个测试结果,而树的每一个叶子节点代表一个类别。很多做策略分析的同学在做用户分析时,会被用户标签、用户画像、用户分群、用户分层这几个概念绕晕。把用户划分为8个群体,从高消费频次、高消费额、最近消费过的重要价值用户,到低消费频次、低消费额、很久未消费的一般挽留用户。随着互联网金融的发展需要,对于信贷产品、用户的精细化运营是未来的主要方向,而开展精细化运营的基础是对用户的理解。..原创 2022-07-28 13:56:59 · 1245 阅读 · 0 评论 -
模型开发SOP及各环节的作用
模型开发sop即指“模型开发标准操作程序”,将开发过程统一为标准操作步骤和要求,用来指导和规范日常的工作。业务有什么样的需求,模型就要做针对性的设计。然而,开发一个好的模型并不是一件轻而易举的事情。所以要确保各个环节合理有效,才能完成整个项目的交付。关键要点包括模型定位的合理性、数据质量的可靠性、建模方法的适用性、模型输出的准确性,以及模型表现的稳定性。...原创 2022-07-10 12:00:00 · 1149 阅读 · 0 评论 -
风控小白必看!主流风控模型解析
一个成熟的风险决策体系核心是由平台积累的海量数据基础,以及上百甚至上千个模型共同作用构成的。本文主要对工作中最常见的违约风险PD模型和差异化定价模型进行介绍。违约风险PD模型在贷款审批方面,如果可以通过构建量化模型对客户的信用等级进行一定的区分。......原创 2022-07-08 10:48:24 · 3293 阅读 · 0 评论 -
你还在做描述性数据分析吗?卡方检验案例实操
关注“金科应用研院”,回复“优快云”领取风控资料合集在风险管理中,对于所获得数据的深度挖掘至关重要。因为如果只是从数据的面相上得出结论,往往容易被数据欺骗从而做出错误的决策。在众多的描述性统计指标之外,为了更好的摸清数据与数据之间的真实关系,也经常会用到一些方法来进行监测,卡方检验就是常用的一种方法。就和少数新冠无症状患者一样,单凭症状评估还不够准确,需要核酸检测才能将人群中的潜在危险给排查出来。卡方检验就是常用的一种方法。什么是卡方检验?卡方检验的英文是Chi-Square Test,主要可.原创 2022-02-08 10:25:59 · 1553 阅读 · 0 评论 -
风控模型中的五大类聚类算法介绍
关注“金科应用研院”,回复“优快云”领取“风控资料合集”聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析的一个重要用途就是针对目标群体进行多指标的群体划分。对目标群体的分类是为了精细化经营,个性化运营的基础和核心,只有进行了正确的分类,才可以有效进行个性化和精细化的运营,服务及产品支持等。聚类分析的算法可以分为五类:划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。以下是常用聚类算法分类图:一、划分法原理:首先要确定一堆散点最后聚成几类,然后挑选原创 2022-01-05 13:58:16 · 2060 阅读 · 0 评论 -
基于逻辑回归算法模型搭建思路
在真实工作场景中,有多种算法依据借贷数据集建立模型,主要使用的算法有逻辑回归、神经网络、决策树、贝叶斯信念网、GBDT算法等,本系列文章旨在为刚入门和对模型感兴趣的同学介绍传统风控模型算法之一——逻辑回归。前方高能!准备发车!逻辑回归算法逻辑回归(LogisticRegression)又称为逻辑回归分析,经常被用于分类,是常用的预测算法之一。通过学习历史数据的特性预测新数据的表现结果。例如,可以将放贷概率设定为因变量,将用户的自身属性以及行为特征属性,例如家庭人员数量、婚姻状况、年龄、同一页面停留时原创 2021-10-11 10:01:38 · 1770 阅读 · 0 评论 -
风控算法知识——WOE值的深度理解与应用
导语:WOE值的深度理解与应用看这一篇就够啦!!!关注“金科应用研院”,回复“礼包”领取风控资料合集WOE是什么?WOE,全称是“Weight of Evidence”,翻译过来就是证据权重,是对于字符型变量的某个值或者是连续变量的某个分段下的好坏客户的比例的对数。实际的应用会将原始变量对应的数据替换为应用WOE公式后的数据,也称作WOE编码或者WOE化。WOE编码需要首先将这个变量分组处也就是分箱。一般选择使用均匀分箱,离散型数据分箱个数就是该数据的数据类别个数,连续型数据一般会使用6组,尽可原创 2021-06-10 10:24:59 · 8921 阅读 · 0 评论