28、无监督学习中的聚类分析方法详解

无监督学习中的聚类分析方法详解

1. FCM 算法与 K-means 算法对比

在聚类分析中,模糊 C 均值(FCM)算法是一种重要的方法。FCM 中,参数 $m$ 的值越大,样本属于某个簇的隶属度 $w(i,j)$ 就越小,这会导致簇的划分更加模糊。隶属度 $w(i,j)$ 的计算公式如下:
$w(i,j) = [\sum_{c = 1}^{k}(\frac{|x(i) - \mu(j)|^2}{|x(i) - \mu(c)|^2})^{\frac{2}{m - 1}}]^{-1}$
若选择三个簇中心,$x(i)$ 属于 $\mu(j)$ 簇的隶属度可按以下方式计算:
$w(i,j) = [(\frac{|x(i) - \mu(j)|^2}{|x(i) - \mu(1)|^2})^{\frac{2}{m - 1}} + (\frac{|x(i) - \mu(j)|^2}{|x(i) - \mu(2)|^2})^{\frac{2}{m - 1}} + (\frac{|x(i) - \mu(j)|^2}{|x(i) - \mu(3)|^2})^{\frac{2}{m - 1}}]^{-1}$
簇的中心 $\mu(j)$ 是所有样本的加权平均值,权重为每个样本属于该簇的隶属度的 $m$ 次方,即:
$\mu(j) = \frac{\sum_{i = 1}^{n}w(i,j)^m x(i)}{\sum_{i = 1}^{n}w(i,j)^m}$
从计算簇隶属度的公式可以看出,FCM 算法每次迭代的计算成本比 K-means 算法高。不过,FCM 通常总体上需要更少的迭代次数就能达到收敛。遗憾的是,FCM 算法目前在 scikit-learn 中尚未实现。但实践表明,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值