基于R的聚类模型(混合模型-基于概率密度分布的聚类方法)

本文介绍了基于R的聚类算法——混合模型,该模型假设样本来自潜在的概率分布混合。通过实例展示了混合模型如何帮助识别数据的聚类结构,与K-means算法对比,表明在某些情况下混合模型能提供更好的聚类效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

混合模型
在上一讲当中,我们给大家介绍了一种比较特殊的聚类算法,DBSCAN。这种算法主要针对一些样本点分布比较特殊的情形,并且我们通过例子发现,传统K-means算法对这种数据无效。在这一讲当中,我们再次看一种比较比较常见,适用情形非常固定的聚类算法,叫做混合模型,这种聚类算法是假设样本分布来自一个潜在的概率分布。或者若干个概率分布的混合。那么样本点的出现也就可以理解为从这个混合分布中抽取的。这样的话有两个好处,第一个好处是,既然每个样本点是来自若干个概率分布的混合,那么每个点相对每个概率分布就会有个权重,这个权重是我们聚类的关键。光是这么说估计大家感到抽象,我们拿例子说明,我们先画一个散点图。代码与图片如下:

# 载入包
library("MASS")
# 载入画图的包
library("ggpubr")
library(ggplot2)
#引入到R空间数据
data("geyser")
#画个散点图
ggplot(geyser,aes(x=duration,y=waiting))+geom_point()

图是这个样子的:

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值