基于最优加权模糊K近邻方法的信用申请人违约概率预测
1. 引言
随着信贷行业的发展,信用评分变得至关重要。信用评分可帮助贷款人依据申请人的特征(如年龄、收入和婚姻状况)决定是否给予信贷。早期的信用评分研究可追溯到20世纪30年代,Fisher和Durand分别应用线性和二次判别分析对信贷申请进行分类。传统的信用评分模型多为统计模型,通过对公司或个人的主要经济和财务指标赋予权重,预测违约风险,得出的信用评分反映借款人的违约概率(PD)。
然而,许多现有的信用评分方法仅关注对客户进行分类,而非评分。从风险管理的角度来看,为每个借款人分配特定的PD更为重要,因为不同客户的违约概率应有所不同。基于个人违约概率,我们可以评估商业银行的投资组合风险,并合理分配有限的资源。因此,本文提出了一种能够同时对申请人进行分类和评分的方法——最优加权模糊K近邻(OWFKNN)算法。
2. 文献综述
本文对2000 - 2010年间发表在学术期刊上的与数据挖掘技术在信用评分中的应用相关的文献进行了全面回顾。通过搜索多个在线期刊数据库,使用相关关键词,筛选出96篇文章进行分类和分析。
2.1 用于信用评分的数据挖掘技术
- 神经网络(NN) :基于人脑功能的非线性统计数据建模工具,能识别数据中的非线性、非加性关系,处理连续和分类预测变量及结果,但对数据的洞察力有限,结果难以解释,且解可能对起始点敏感。
- 贝叶斯分类器(BC) :基于贝叶斯定理的简单概率分类器,适用于高维输入,但预测准确性高度依赖其独立性假设。优点是只需少量训练数据来估
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



