聚类 K-means & K-medoids 算法

本文详细介绍了K-means和K-medoids两种聚类算法的原理、MATLAB实现代码,并通过生成三个高斯分布数据集进行实验验证了算法的有效性。K-medoids算法相较于K-means具有更高的鲁棒性,因为它使用实际数据点作为中心点。

关于K-means和K-medoids的描述,参见pluskid博客http://blog.pluskid.org/?tag=clustering或http://blog.youkuaiyun.com/abcjennifer/article/details/8197072

下面给出首先给出matlab关于K-means的matlab代码:

function [labels,Cnt] = kmeans(k,D,threshold=1e-10)
%KMEANS Summary of this function goes here
    %Detailed explanation goes here
    N=length(D);
    R_I = randperm(N,k);  
    Cnt = D(R_I,:);
    %k Random cluster centre;
    labels=zeros(N,1);
    while(true)
        dist=zeros(k,1);
        for l=1:N
            for i=1:k
               dist(i)=norm(D(l,:)-Cnt(i,:));
            end
            [~,t]=min(dist);
            labels(l)=t;
        end
        sum=zeros(k,2);
        cont=zeros(k,1);
        for l=1:N
            sum(labels(l),:)=sum(labels(l),:)+D(l,:);
            cont(labels(l),:)=cont(labels(l),:)+1;
        end
        for i=1:k
            sum(i,:)=sum(i,:)/cont(i,:);
        end
        %average, and obtain new centres;
        if norm(Cnt-sum)<threshold
            break;
        else
            Cnt=sum;
        end
    end
end
实验的数据采用三个高斯分布生成
% generate out Gaussian distribution samples;
mu=[0,-15];
sigma=[45 ,0;0,45];
r1=mvnrnd(mu,sigma,300);
mu=[5,15];
sigma=[15 ,0;0,15];
r2=mvnrnd(mu,sigma,300);
mu=[-5,7];
sigma=[15,0;0,15];
r3=mvnrnd(mu,sigma,300);
figure;
plot(r1(:,1),r1(:,2),'r*',r2(:,1),r2(:,2),'b*',r3(:,1),r3(:,2),'g*');
title('the generating data');
D=[r1;r2;r3]

medoids算法要求计算centres的值在已有的数据点中,这样提高了鲁棒性,因此需要计算每一个点在该类中的距离:

function [labels,Cnt] = kmedoids(k,D,threshold)
%KMEDOIDS Summary of this function goes here
%   Detailed explanation goes here
    N=length(D);
    R_I = randperm(N,k);  
    Cnt = D(R_I,:);
    %k Random cluster centre;
    labels=zeros(N,1);
    while(true)
        dist=zeros(k,1);
        for l=1:N
            for i=1:k
               dist(i)=norm(D(l,:)-Cnt(i,:));
            end
            [~,t]=min(dist);
            labels(l)=t;
        end
        dist_mat=cell(k,1);
        for s=1:k
            dist_mat{s}=zeros(N,N);
        end
        for l=1:N
            for p=l+1:N
                if labels(l)~=labels(p)
                    continue;
                else
                    dist_mat{labels(l)}(l,p)=norm(D(p,:)-D(l,:));
                    dist_mat{labels(l)}(p,l)=dist_mat{labels(l)}(l,p);
                end
            end
        end
        Cnt_=D(R_I,:);
        for s=1:k
            temp=sum(dist_mat{s},1,'double');
            [~,t]=min(temp);
            minimal=realmax;
            for l=1:N
                if (minimal > temp(l)) & (labels(l)==s)
                    minimal=temp(l);
                    Cnt_(s,:)=D(l,:);
                end
            end
        end
        %average, and obtain new centres;
        if norm(Cnt-Cnt_)<threshold
            break;
        else
            Cnt=Cnt_;
        end
    end
end


代码转载自:https://pan.quark.cn/s/7f503284aed9 Hibernate的核心组件总数达到五个,具体包括:Session、SessionFactory、Transaction、Query以及Configuration。 这五个核心组件在各类开发项目中都具有普遍的应用性。 借助这些组件,不仅可以高效地进行持久化对象的读取与存储,还能够实现事务管理功能。 接下来将通过图形化的方式,逐一阐述这五个核心组件的具体细节。 依据所提供的文件内容,可以总结出以下几个关键知识点:### 1. SSH框架详细架构图尽管标题提及&ldquo;SSH框架详细架构图&rdquo;,但在描述部分并未直接呈现关于SSH的详细内容,而是转向介绍了Hibernate的核心接口。 然而,在此我们可以简要概述SSH框架(涵盖Spring、Struts、Hibernate)的核心理念及其在Java开发中的具体作用。 #### Spring框架- **定义**:Spring框架是一个开源架构,其设计目标在于简化企业级应用的开发流程。 - **特点**: - **分层结构**:该框架允许开发者根据实际需求选择性地采纳部分组件,而非强制使用全部功能。 - **可复用性**:Spring框架支持创建可在不同开发环境中重复利用的业务逻辑和数据访问组件。 - **核心构成**: - **核心容器**:该部分包含了Spring框架的基础功能,其核心在于`BeanFactory`,该组件通过工厂模式运作,并借助控制反转(IoC)理念,将配置和依赖管理与具体的应用代码进行有效分离。 - **Spring上下文**:提供一个配置文件,其中整合了诸如JNDI、EJB、邮件服务、国际化支持等企业级服务。 - **Spring AO...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值