数据挖掘
文章平均质量分 56
是慕斯呀
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘——分类数据集letter-recognition
提供2000组训练数据,包含16个数值属性和字母种类,利用这2000组训练数据构造决策树分类器,并预测给定的2000组测试数据的字母种类,与给定的测试集的字母种类进行比较给出测试集正确率。决策树分类器具有可解释性好和易于理解的优点,但也存在过拟合和错误分类的问题。决策树由根节点、分支节点和叶节点组成,其中根节点表示数据集中所有实例的特征属性集合,分支节点表示根节点的一个属性划分,叶节点表示分类结果。利用2000个训练数据,构造决策树分类器,预测2000个测试数据的类别,并给出测试集正确率的估计值及依据。原创 2024-04-11 21:19:13 · 947 阅读 · 1 评论 -
数据挖掘-----探索数据iris
本实验提供iris.xls文件,鸢尾花数据集包含150种鸢尾花的信息,每50种取自三个鸢尾花种之一:Setosa,Versicolour和Virginica。每个花的特征用5种属性描述:萼片长度,萼片宽度,花瓣长度,花瓣宽度,鸢尾花种类。通过给定数据,研究鸢尾花数据集的每对属性的关系,并画出散布图。不同的鸢尾花种类使用不同的标记进行表示。利用matlab中的gplotmatrix函数根据数据集中的类属性对数据进行分组,为数据集中的每个变量组合创建散点图矩阵。对角线的直方图显示了不同花对应属性长度值的分布。原创 2024-04-11 21:15:21 · 753 阅读 · 1 评论
分享