数据挖掘算法--聚类分析

1. 聚类分析的提出

物以类聚,人以群分!志同而道合,即具有相同特点的物体(或人类)往往更容易走近,从而形成自己的一个“圈子”。
在现代零售行业,顾客群细分是最为常见的一种业务需求,一般情况下,会从客户性别、年龄、职业、消费金额等一个变量进行分组,或者几个简单变量交叉分组。但这种传统的客户细分模式往往会体现以下弊端:
1)客户细分之前,需要人为指定分类变量,需要用几个变量、什么变量往往受人为因素影响较大。
2)人为制定的分类属性,往往体现了群体的局部特征,并不能描述群体的整体特征。
相比而言,聚类分析是解决传统客户细分的有效方法。它能够将数据样本,在没有先验知识的前提下,依据数据的整体属性,依照其内在的亲疏程度进行自动分组,能够使组内个体尽可能亲密,组间个体尽可能疏远。
此处所指,没有先验知识是无需提前设定分类属性;亲疏程度一般有两个评估标准,相似程度和差异程度。

2. 聚类算法分类

依照不同的分类标准,可以从不同角度对聚类算法进行划分:
(1)聚类结果角度
聚类算法可以分为覆盖聚类算法和非覆盖聚类算法。覆盖聚类算法指的是任何一个个体都会隶属于至少一个类,反之则为非覆盖聚类算法。
聚类算法还可以分为层次聚类和非层次聚类,层次聚类指的存在一个类属于另外一个类的子集,反之则成为非层次聚类。
聚类算法还可以分为确定聚类和模糊聚类。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值