

中国有句谚语叫“”物以类聚,人以群分“”,刨除这句话的贬义部分来看,用来形容聚类分析再合适不过。聚类分析就是对物(人),根据其各自的特征进行分类的一种多元统计分析方法,同类(同群)之间的物品(人)的特征尽可能相似,不同类(同群)之间的物品(人)的特征尽可能不同。
聚类分析的基本流程为根据样品的多个观测指标,找出能够度量样品之间相似度的统计量,然后以统计量为依据,将关系密切的样本归类到一个小的分类单位,关系疏远的归类到一个大的分类单位,直到将所有样本聚合完毕,形成一个由小到大的分类系统。在整个聚类分析的过程中主要有以下四大特点:
(1)聚类分析的对象是物(人),即样本;
(2)聚类分析是根据物(人)的特征来进行聚集的,选取的特征不一样,聚类的结果也会存在差异;
(3)聚类分析的关键点在于度量样本的相似性;
(4)聚类分析结果的好坏没有统一的评判标准;
从聚类分析的定义中不难看出,其作用主要是对样本的归类,运用到现实中即对用户的精准细分,方便企业为其提供有针对性的产品和服务。例如银行根据一定指标将用户划分为金卡用户、银卡用户和普通卡用户,这种分法一方面能很好的节约银行的资源,另外一方面也能针对不同的用户实行分级服务,提升用户体验。再比如移动开发的全球通、神州行和动感地带三个套餐或者品牌,实际就是根据用户的行为习惯做了很好的聚