数据挖掘实例一、预测鸢尾花的类型

该博客通过鸢尾花数据集介绍了一个数据挖掘任务,旨在根据花瓣宽度和长度预测鸢尾花属于Setosa、Versicolour、Virginica中的哪一类。博客中提到的规则将花瓣宽度和长度分为low、medium、high三个类别,并展示了如何利用这些规则对大部分鸢尾花进行有效分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

鸢(yuan)尾花也叫做爱丽丝Iris,外形如下图

现在有如下的数据采样集

参看WIKI数据

http://zh.wikipedia.org/wiki/%E5%AE%89%E5%BE%B7%E6%A3%AE%E9%B8%A2%E5%B0%BE%E8%8A%B1%E5%8D%89%E6%95%B0%E6%8D%AE%E9%9B%86

考虑如下任务:根据花的特征预测花的种类。本例考虑根据是否属于Setosa、Versicolour、Virginica这三类之一对鸢尾花(Iris)进行分类。花瓣宽度分成low、medium、high三类,分别对应于区间[0, 0.75)、[0.75, 1.75)、[1.75,  )。花瓣长度也分成low、medium、high三类,分别对应于区间[0, 2.5)、[2.5, 5)、[5,  )。根据花瓣宽度和长度的这些类别,可以推出如下规则。

花瓣宽度和花瓣长度为low蕴涵Setosa。

花瓣宽度和花瓣长度为medium蕴涵Versicolour。

花瓣宽度和花瓣长度为high蕴涵Virginica。


尽管这些规则不能对所有的花进行分类,但是已经可以对大多数花很好地进行分类(尽管不完善)。注意:根据花瓣宽度和花瓣长度,Setosa种类的花完全可以与Versicolour和Virginica种类的花分开,但是后两类花在这些属性上有一些重叠。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值