人工智能_机器学习081_聚类评价指标_轮廓系数_公式理解---人工智能工作笔记0121

聚类效果如何评估?轮廓系数是一个关键指标。该系数衡量了样本在所属簇内的紧密度(a)和与其他簇的距离(b)。理想情况下,a接近0表示簇内紧密,b越大表示簇间距离远,从而得出较大的轮廓系数值,表示聚类质量高。通过这个公式,我们可以判断KMeans等聚类算法的效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

然后我们再来看,那么对于数据来说,我们分成几类比较合适呢,怎么衡量呢?

我们之前做分类的时候,用的是准确率对吧,然后做回归问题的时候,用均方误差.

而我们在Kmeans衡量分成几类比较好用的函数是,轮廓系数对吧,可以看到上面是

轮廓系数的公式

可以看到,他有两个点  可以看到公式中的a和b

a,表示 某个样本 和 它所在的簇内的,其他样本的平均距离, 其实聚类分的好不好,主要是,我们希望一个类别,也就是一个簇中,的数据点,帖的越紧密越好对吧.

b.某个样本 与其他簇内样本的平均距离, 这个其实就是说簇 与 簇之间的距离越远越好对吧,就表示分的越开 对吧

所以根据公式我们可以看到,

假如当a=0 ,那么这个时候 S的值最大对吧,因为 分子最大 对吧,所以轮廓系数公式 的值越大越好

我们希望a越小越好,最小是0  然后b越大越好对吧.

这个就是轮廓系数公式,用来衡量 聚类算法分的好不好

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

添柴程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值