SPSS的算法介绍与实现

最新推荐文章于 2025-06-26 14:35:24 发布

亿是守候 & 亿是承诺

最新推荐文章于 2025-06-26 14:35:24 发布

阅读量3.1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：大数据文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_48678602/article/details/109371719

文章目录

1.聚类分析
- 1.1 K-均值聚类
- 1.2 系统聚类
2.主成分分析
3.时间序列

本文介绍一些常用的算法和如何使用SPSS实现

1.聚类分析

1.概述
聚类分析(cluster analysis)也称群分析、点群分析，是一种无监督学习，与回归分析、多元分析称为多元分析的三大方法。是一个把数据对象划分成子集的过程。每个子集是一个簇(cluster)，使得簇中的对象彼此相似，但是与其他簇中的对象不相似。由聚类分析产生的一个簇的集合叫做一个聚类。

2.基本思想：
我们所研究的样品或指标（变量）之间存在程度不同的相似性（亲疏关系——以样品间距离衡量）。于是根据一批样品的多个观测指标，具体找出一些能够度量样品或指标之间相似程度的统计量，以这些统计量为划分类型的依据。把一些相似程度较大的样品（或指标）聚合为一类，把另外一些彼此之间相似程度较大的样品（或指标）又聚合为另一类，直到把所有的样品（或指标）聚合完毕，满足“类内差异小，类间差异大”，这就是分类的基本思想。也就是“物以类聚”的思想。

在这里插入图片描述

3.聚类分析的步骤

步骤1：选择聚类分析变量；

这些变量应具备以下特点：
1）和聚类分析的目标相关；
2）反映了要分类对象的特征；
3）在不同对象的值具有明显差异；
4）变量之间不应该高度相关
对于变量高度相关的处理办法（两种）：
1）在对案例聚类分析之前，先对变量进行聚类分析，在各类中选择具有代表性的变量作为聚类变量；
2）对变量做因素分析，产生一组不相关变量作为聚类变量。
步骤2：计算相似性
相似性(Similarity)是聚类分析的一

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。