13、借贷数据聚类与神经网络特征提取应用

借贷数据聚类与神经网络特征提取应用

在处理借贷俱乐部(Lending Club)的无担保个人贷款申请数据时,我们可以运用多种聚类算法和神经网络技术来进行数据分析和特征提取,以实现更好的贷款评估和客户分类。

1. 聚类算法应用
1.1 k-Means聚类

k-Means聚类是一种常用的聚类算法,在使用借贷俱乐部数据集时,我们需要指定期望的聚类数 $k$,算法会将每个借款人精确地分配到这 $k$ 个聚类中的一个。其目标是最小化簇内变异(也称为惯性),使得所有 $k$ 个聚类的簇内变异之和尽可能小。

为了找到最佳的 $k$ 值,我们进行了一个实验,将 $k$ 的范围设定为 10 到 30,并绘制了上一节定义的准确率度量结果。以下是具体的代码实现:

from sklearn.cluster import KMeans
n_clusters = 10
n_init = 10
max_iter = 300
tol = 0.0001
random_state = 2018
n_jobs = 2
kmeans = KMeans(n_clusters=n_clusters, n_init=n_init, 
                max_iter=max_iter, tol=tol, 
                random_state=random_state, n_jobs=n_jobs)
kMeans_inertia = pd.DataFrame(data=[],index=range(10,31), 
                              colum
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值