6、基于 SVDD 分类模型的客户信用评分预测方法

基于 SVDD 分类模型的客户信用评分预测方法

在银行客户信用评分领域,由于良好记录和不良记录两类样本数量存在明显差异,这属于不平衡数据集的模式分类问题。传统加权 SVM 模型手动确定正负样本权重具有主观性,而 SVDD 模型为解决这一问题提供了新的思路。本文将详细介绍 SVDD 模型及其在客户信用评分预测中的应用。

1. SVDD 模型基础

SVDD 模型主要用于构建一个最优的封闭高维超球体,将正例样本包含在超球体内,而异常值位于超球体外部,可用于描述数据集和检测异常值。下面从不同角度详细阐述 SVDD 模型。

1.1 描述一类样本的 SVDD 模型

设已知样本数据集为 ${x_i, i = 1,2,\cdots,N}$,其中 $N$ 为样本数量。SVDD 模型的目标是用一个半径最小的超球体在特征空间中描述该数据集,即所有样本应位于超球体内。其数学形式为最小化函数 $F(R, \mathbf{a}) = R^2$,约束条件为 $|x_i - \mathbf{a}|^2 \leq R^2, \forall i = 1,2,\cdots,N$。

若数据集中存在异常值,样本到超球中心的距离可能不严格小于 $R$,因此引入松弛变量 $\xi_i \geq 0, (i = 1,2,\cdots,N)$ 到目标函数中。问题可描述为以下带有不等式约束的二次规划问题:
[
\begin{cases}
\min_{R, \mathbf{a}, \xi} R^2 + C\sum_{i = 1}^{N} \xi_i \
\text{s.t. } |x_i - \mathbf{a}|^2 \leq R^2 + \xi_

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值