【R统计】基于欧几里得距离进行的聚类分析

该博客通过1990年全国人口普查数据,选取大学、初中、文盲文化程度比例作为指标,运用R语言进行聚类分析。采用最长距离法、均值法、重心法、ward法以及动态聚类法,将30个地区分为4类,并绘制了谱系图。具体分类结果和详细脚本来源于《统计建模与R软件》一书。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:

为了深入地了解我国人口的文化程度,利用1990年全国普查数据对全国30个省、直辖市、自治区进行聚类分析,分别选用了三个指标:(1)大学以上文化程度的人口占全部人口的比例(DXBZ);(2)初中文化程度的人口占全部人口的比例(CZBZ);(3)文盲半文盲人口占全部人口的比例(WMBZ)分别用来反映较高、中等、较低文化程度人口的状况。(1)计算样本的欧几里得距离,分别用最长距离法、均值法、重心法和ward法作聚类分析,并画出相应的谱系图,如果将所有样本分为4类,试写出个种方案的分类结果;(2)用动态聚类方法(共分为4类),给出相应的分类结果。

数据:

地区	DXBZ	CZBZ	WMBZ
北京	9.30	30.55	8.70
天津	4.67	29.38	8.92
河北	0.96	24.69	15.21
山西	1.38	29.24	11.30
内蒙古	1.48	25.47	15.39
辽宁	2.60	32.32	8.81
吉林	2.15	26.31	10.49
黑龙江	2.14	28.46	10.87
上海	6.53	31.59	11.04
江苏	1.47	26.43	17.23
浙江	1.17	23.74	17.46
安徽	0.88	19.97	24.43
福建	1.23	16.87	15.63
江西	0.99	18.84	16.22
山东	0.98	25.18	16.87
河南	0.85	26.55	16.15
湖北	1.57	23.16	15.79
湖南	1.14	22.57	12.10
广东	1.34	23.04	10.45
广西	0.79	19.14	10.61
海南	1.24	22.53	13.97
四川	0.96	21.65	16.24
贵州	0.78	14.65	24.27
云南	0.81	13.85	25.44
西藏	0.57	3.85	44.43
陕西	1.67	24.36	17.62
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值