吴恩达老师机器学习笔记K-means聚类算法(一)

本文详细介绍了K-means聚类算法的工作原理及其在实际数据集上的应用过程。通过随机选择初始聚类中心,迭代更新聚类中心,直至找到成本函数最小化的聚类结果。代码实现展示了如何通过计算样本到中心的距离来确定样本所属类别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天接着学习聚类算法

以后坚决要八点之前起床学习!不要浪费每一个早晨。

K-means聚类算法聚类过程如下:

在这里插入图片描述
原理基本就是先从样本中随机选择聚类中心,计算样本到聚类中心的距离,选择样本最近的中心作为该样本的类别。最后某一类样本的坐标平均值作为新聚类中心的坐标,如此往复。
原始数据如下:
在这里插入图片描述
代码如下:

load('ex7data2');
[m n]=size(X);
x=zeros(m,n+1);
x(1:m,1:n)=X;
Z_min=9999999; 
y=zeros(m,1); % 最优类别结果
for iter=1:100 % 选择最优的聚类的结果
    start=round(rand(3,1)*(m-1)+1); % 随机化聚类中心
    start_centre=X(start,:);
    Z_sum=0;
    for j=1:200 % 判断样本距离最近的中心
        for i=1:m
            Z=sum((x(i,1:n)-start_centre(:,1:n)).^2,2);
            [min_value,min_index]=min(Z);
            x(i,n+1)=min_index;
        end
        for i=1:3 % 聚类数量选择3类
            start_centre(i,:)=mean(X(x(:,n+1)==i,:)); % 生成新的聚类中心
        end
    end
    for i=1:m % 计算成本函数
        Z_sum=sum((x(i,1:n)-start_centre(x(i,n+1),1:n)).^2,2)+Z_sum;
    end
    if Z_min>Z_sum % 选取成本最小的结果作为最优结果
       Z_min=Z_sum;
       y=x(:,n+1);      
    end       
end
scatter(X(:,1),X(:,2),8,y,'filled');

最后聚类结果如下:
在这里插入图片描述
这次代码非常的简单了。。。。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值