鸢尾花数据集与相关研究概述
1. 鸢尾花数据集介绍
鸢尾花数据集由3个类别组成,每个类别包含50个样本。这三个类别分别是不同类型的花朵,如Setosa(类别1)、Versicolor(类别2)和Virginica(类别3)。这些类别由四个变量描述,分别是花瓣的长度和宽度,以及萼片的长度和宽度。该数据集可以从 ftp.ics.uci.edu/pub/machine - learning - databases 获取。
下面用表格展示数据集的基本信息:
| 类别 | 样本数量 | 描述变量 |
| ---- | ---- | ---- |
| Setosa(类别1) | 50 | 花瓣长度、花瓣宽度、萼片长度、萼片宽度 |
| Versicolor(类别2) | 50 | 花瓣长度、花瓣宽度、萼片长度、萼片宽度 |
| Virginica(类别3) | 50 | 花瓣长度、花瓣宽度、萼片长度、萼片宽度 |
2. 相关研究领域及部分成果
在机器学习和数据挖掘领域,有众多关于分类、聚类、特征选择等方面的研究。以下列举一些相关研究成果:
- 分类与回归树 :Breiman L等人在1984年提出了分类与回归树(Classification and Regression Trees),这是一种用于分类和回归分析的决策树模型。
- 特征选择 :Kira K和Rendell LA在1992年探讨了特征选择问题,提出了传统方法和新算法。
- 聚类算法 :Gupta
超级会员免费看
订阅专栏 解锁全文

955

被折叠的 条评论
为什么被折叠?



