机器学习——鸢尾花数据集

本文介绍了鸢尾花数据集的基本情况,包括数据集的结构和内容。通过导入数据集并进行可视化尝试,发现二维和三维图无法有效区分鸢尾花的三个品种。于是,文章引入主成分分析(PCA)进行降维,展示如何利用PCA将四维数据降至三维,以达到更好的分类效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习——鸢尾花数据集

鸢尾花数据集即iris
iris数据集文件: https://pan.baidu.com/s/1saL_4Q9PbFJluU4htAgFdQ .提取码:1234

数据集简介

  • 数据集包含150个样本(数据集的行)
  • 数据集包含4个属性(数据集的列):Sepal Length,Sepal Width,Petal Length,Petal Width:‘feature_names’
  • 利用numpy.ndarray存储这150x4的数据:‘data’
  • 分类标签取自array[‘Setosa’,‘Versicolour’,‘Virginica’]:‘target_names’
    Setosa,Versicolour,Virginica是数据集所包含的3中品种的鸢尾花
    这3个分类标签(即150x1数据)用np.ndarray存储:‘target’
    总之,这个数据存储了150x4的特征数据和150x1的分类标签,其中特征数据又放在‘data’里,分类标签放在‘target’里

导入数据集

import matplotlib.pyplot as plt    #绘图
from mpl_toolkits.mplot3d import Axes3D   #可视化
from sklearn import datasets    #sklearn中包含很多数据集,其中就有鸢尾花数据集
from sklearn.decomposition import PCA    #主成分分析
import numpy as np   #机器学习中通常将数据以数组的形式存储,特别是这里包含了特征数据和分类数据

iris = datasets.load_iris()   #利用load函数装载数据集

print('鸢尾花数据集的数据类型是:',type(iris))  
  
print('鸢尾花数据集的数据有:',dir(iris))
for i in dir(iris):
	eval('print(i,"/t",type(iris.'+i+'))')   #遍历数据集中的数据,查看每个数据的数据类型
print()    

print('鸢尾花数据集中feature_names取值:',iris.feature_names)
print('鸢尾花数据集中数据的行列数:',iris.data.shape)
print('鸢尾花数据集中target取值:',np.unique(iris.target))
print('鸢尾花数据集中target_names的取值:',iris.target_names)   

结果:在这里插入图片描述

可视化

figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True)

  • num:图像编号或名称,数字为编号 ,字符串为名称
  • figsize:指定figure的宽和高,单位为英寸;
  • dpi参数指定绘图对象的分辨率,即每英寸多少个像素,缺省值为80 1英寸等于2.5cm,A4纸是 21*30cm的纸张
  • facecolor:背景颜色
  • edgecolor:边框颜色
  • frameon:是否显示边框

matplotlib中cla/clf/close用法及相关清除效果

  • 在使用matplotlib画图时,画完图之后需要进行一定的清理工作,否则后续画图的结果中可能混入前一幅图的数据,或者造成频繁创建绘图对象。下面解释一下matplotlib中的相关清理操作和效果。主要包括以下方法:
    • gca获取当前的axes,cla清理当前的axes
    • gcf获取当前的figure,clf清理当前的figure
    • close,关闭figure
a,b=0,<
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值