基于 SVDD 分类模型的客户信用评分预测方法
在银行客户信用评分领域,由于良好记录和不良记录两类样本数量存在明显差异,这属于不平衡数据集的模式分类问题。传统加权 SVM 模型手动确定正负样本权重具有主观性,而 SVDD 模型为解决这一问题提供了新的思路。本文将详细介绍 SVDD 模型及其在客户信用评分预测中的应用。
1. SVDD 模型基础
SVDD 模型主要用于构建一个最优的封闭高维超球体,将正例样本包含在超球体内,而异常值位于超球体外部,可用于描述数据集和检测异常值。下面从不同角度详细阐述 SVDD 模型。
1.1 描述一类样本的 SVDD 模型
设已知样本数据集为 ${x_i, i = 1,2,\cdots,N}$,其中 $N$ 为样本数量。SVDD 模型的目标是用一个半径最小的超球体在特征空间中描述该数据集,即所有样本应位于超球体内。其数学形式为最小化函数 $F(R, \mathbf{a}) = R^2$,约束条件为 $|x_i - \mathbf{a}|^2 \leq R^2, \forall i = 1,2,\cdots,N$。
若数据集中存在异常值,样本到超球中心的距离可能不严格小于 $R$,因此引入松弛变量 $\xi_i \geq 0, (i = 1,2,\cdots,N)$ 到目标函数中。问题可描述为以下带有不等式约束的二次规划问题:
[
\begin{cases}
\min_{R, \mathbf{a}, \xi} R^2 + C\sum_{i = 1}^{N} \xi_i \
\text{s.t. } |x_i - \mathbf{a}|^2 \leq R^2 + \xi_
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



