k-means算法实现鸢尾花数据集的聚类

一、算法思想

鸢尾花数据集:共收集了三类鸢尾花,即Setosa鸢尾花Versicolour鸢尾花和Virginica鸢尾花,每一类鸢尾花收集了50条样本记录,共计150条。数据集包括4个属性,四个属性的单位都是cm,属于数值变量,四个属性均不存在缺失值的情况,字段如下:sepal length(萼片长度)、sepal width(萼片宽度)、petal length(花瓣长度)、petal width (花瓣宽度)。

K-means算法:根据样本之间的距离或者说是相似性(亲疏性),把越相似、差异越小的样本聚成一(簇),最后形成多个簇,使同一个簇内部的样本想似度高,不同簇之间差异性高。

 

二、流程图

 

三、实验结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值