13、借贷数据聚类与神经网络特征提取应用

最新推荐文章于 2025-10-05 19:44:16 发布

code8

最新推荐文章于 2025-10-05 19:44:16 发布

阅读量25

点赞数

CC 4.0 BY-SA版权

分类专栏：解锁无监督学习的秘密文章标签： k-Means聚类层次聚类 HDBSCAN

本文链接：https://blog.youkuaiyun.com/code8/article/details/152289084

解锁无监督学习的秘密专栏收录该内容

24 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

借贷数据聚类与神经网络特征提取应用

在处理借贷俱乐部（Lending Club）的无担保个人贷款申请数据时，我们可以运用多种聚类算法和神经网络技术来进行数据分析和特征提取，以实现更好的贷款评估和客户分类。

1. 聚类算法应用

1.1 k-Means聚类

k-Means聚类是一种常用的聚类算法，在使用借贷俱乐部数据集时，我们需要指定期望的聚类数 $k$，算法会将每个借款人精确地分配到这 $k$ 个聚类中的一个。其目标是最小化簇内变异（也称为惯性），使得所有 $k$ 个聚类的簇内变异之和尽可能小。

为了找到最佳的 $k$ 值，我们进行了一个实验，将 $k$ 的范围设定为 10 到 30，并绘制了上一节定义的准确率度量结果。以下是具体的代码实现：

from sklearn.cluster import KMeans
n_clusters = 10
n_init = 10
max_iter = 300
tol = 0.0001
random_state = 2018
n_jobs = 2
kmeans = KMeans(n_clusters=n_clusters, n_init=n_init, 
                max_iter=max_iter, tol=tol, 
                random_state=random_state, n_jobs=n_jobs)
kMeans_inertia = pd.DataFrame(data=[],index=range(10,31), 
                              colum