K-means K 值选择

本文介绍了K-means算法中选择合适的K值的三种方法:拍脑袋法,即样本量除以2再平方;肘部法则,通过观察随着K值增加成本函数变化找出转折点;以及轮廓系数法,寻找群组凝聚度和分离度的最佳平衡点。这些方法有助于找到合适的K值,从而提高聚类效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

K-means K 值选择

拍脑袋法

一个非常快速的,拍脑袋的方法是将样本量除以2再平方出来的值作为K值:

# python 求平方根函数
import numpy  as np
import math 
# numpy 库
print("np.sqrt(4):",np.sqrt(4))
#  内置函数
print("pow(4,0.5):", pow(4,0.5))
# math 库
print("math.sqrt(4):",math.sqrt(4))

在这里插入图片描述

# n 为样本数
n=200
k=np.sqrt(n/2)
k

在这里插入图片描述

肘部法则

Elbow Method :Elbow意思是手肘,此种方法适用于 K 值相对较小的情况,当选择的k值小于真正的时,k每增加1,cost值就会大幅的减小;当选择的k值大于真正的K时, k每增加1,cost值的变化就不会那么明显。这样,正确的k值就会在这个转折点,类似elbow的地方。

# clustering dataset
# determine k using elbow method

from sklearn.cluster import KMeans
from scipy.spatial.distance import cdist
import numpy as np
import matplotlib.pyplot as plt

x1 = np.array([3, 1, 1, 2, 1, 6, 6, 6, 5, 6, 7, 8, 9, 8, 9, 9, 8])
x2 = np.array([5, 4, 5, 6, 5, 8,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值