关于聚类分析
什么是聚类?聚类是聚合或分组数据的一种方式。聚类允许使用多个变量来创建分组(使用模型 k-means 聚类)。在 Tableau 中如何实现聚类分析?可以尝试使用 R 。
Tableau 可以通过 R 做一些高级分析:例如主成分析、因子分析、聚类分析、分类分析等等。
我们示例一个聚类分析的场景:随着我国居民生活水平不断提升,消费需求也不断增长,但消费结构仍存在一定的地域性差异。如果可以让相近消费水平城市会聚成一类,就很容易看出各个城市的相近与差异。
因此,我们想利用聚类分析方法对我国31个省(直辖市、自治区)城镇居民消费结构进行研究与分析,发现各区域消费结构的差异,从而为各地政府提供更加有效的决策依据。
通过 聚类分析呈现城镇居民消费水平 为大家分享:在 Tableau 中使用 R 做聚类分析。
为方便学习,我们使用中国统计年鉴2012年统计数据(如下图)。
Tips:为了消除各地区在区域面积、人口等方面的先天差异,使数据的分析结果更合理,这里的指标均采用