K-means算法和模糊C均值算法对比

本文对比了模糊C均值(FCM)和K-means两种聚类算法。FCM基于模糊理论,通过优化目标函数确定样本点的隶属度,适用于模糊边界的数据。K-means则是迭代求解,将样本分配给最近的聚类中心。实验结果显示,FCM在精度上可能稍逊于K-means,但对数据的隶属度有更灵活的表示。FCM在图像分割和大规模数据分析中有广泛应用,而K-means因其效率高,常用于处理大数据集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据集来源

seismic-bumps
数据集属性解释如下:
在这里插入图片描述
最后一个也就是第十九个属性是决策属性,它的含义是下个班次时是否会发生高能地震波由它将数据集分成两个大类,下个班次不会发生高能地震(class=0)占93.4%,会发生高能地震占6.6%
在这里插入图片描述

模糊C均值算法

原理

模糊c-均值聚类算法: fuzzy c-means algorithm (FCMA)或称( FCM)。在众多模糊聚类算法中,模糊C-均值( FCM) 算法应用最广泛且较成功,它是通过优化目标函数得到每个样本点对所有类中心的隶属度,隶属度范围为[0,1],从而决定样本点的类属以达到自动对样本数据进行分类的目的。

模糊理论的数学基础(模糊集合)

定义

  1. 论域:所讨论的全体对象,一般用U表示
  2. 元素:论域中的某个具体对象,可以用x1,x2,x3等表示
  3. 集合:论域中具有某种相同属性的确定的,可以区分彼此的元素的全体,常用A,B等表示。

模糊逻辑给集合中每一个元素赋予一个介于0和1之间的实数,描述其属于一个集合的强度,这个实数被称为元素属于一个集合的隶属度。集合中所有元素的隶属度全体构成集合的隶属函数

表示方法

A = { x i , μ A ( x i ) ∣ x i ∈ U } A=\{x_i,μ_A(x_i)|x_i∈U\} A={ xi,μA(xi)xiU}
μ A ( x i ) 表 示 元 素 x i 属 于 模 糊 集 合 A 的 隶 属 度 , U 则 是 论 域 μ_A(x_i)表示元素x_i属于模糊集合A的隶属度,U则是论域 μA(xi)xiAU

Zadeh表示法
  1. 论域是离散且元素数目有限
    A = μ A ( x 1 ) / x 1 + μ A ( x 2 ) / x 2 + … + μ A ( x n ) / x n A=μ_A(x_1)/x_1+μ_A(x_2)/x_2+…+μ_A(x_n)/x_n A=μA(x1)/x1+μA(x2)/x2++μA(xn)/xn
    或者
    A = { μ A ( x 1 ) / x 1 , μ A ( x 2 ) / x 2 , … , μ A ( x n ) / x n } A=\{μ_A(x_1)/x_1,μ_A(x_2)/x_2,…,μ_A(x_n)/x_n\} A={ μA(x1)/x1,μA(x2)/x2,,μA<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值