使用matplotlib中的scatter绘图函数分析iris数据集中的特征属性

iris数据集导入有好几种方式,本文采用的是从sklearn包中直接导入使用,并选取期中两列的属性,用散点图分析,
代码参考了《机器学习实战》
# import numpy as np
# from numpy import *
# import  operator
from sklearn.datasets import load_iris
# import matplotlib
import matplotlib.pyplot as plt
<
Matplotlib是一个强大的Python数据可视化库,可以用于创建各种图表,包括数据探索中的散点图、直方图等。对于鸢尾花数据集,这是一个经典的机器学习示例,包含了三种不同类型的鸢尾花(Setosa, Versicolour, Virginica)的数据。 为了利用Matplotlib进行数据探索,首先你需要加载鸢尾花数据集,比如通过scikit-learn库的load_iris函数。然后,你可以按照以下步骤操作: 1. **数据预处理**:将数据拆分为特征和目标变量,通常使用花瓣长度(petal length)、花瓣宽度(petal width)作为二维或三维的散点图坐标,因为它们通常能较好地区分鸢尾花的不同类别。 2. **绘制散点图**: - 对于两个特征,例如花瓣长度和宽度,你可以创建一个`plt.scatter()`图形,x轴表示花瓣长度,y轴表示花瓣宽度,每种颜色代表一种鸢尾花类型。 - 对于三个特征,可以使用3D散点图,`mpl_toolkits.mplot3d.Axes3D`模块可以帮助你完成。 3. **添加标题和标签**:给图表添加适当的标题,X轴和Y轴的标签,以及每个颜色的类别名称。 4. **显示图像**:最后使用`plt.show()`展示你的可视化结果。 5. **还可以尝试其他统计图形**,如直方图、箱线图等,进一步了解数据分布。 ```python import matplotlib.pyplot as plt from sklearn import datasets # 加载鸢尾花数据 iris = datasets.load_iris() X = iris.data[:, :2] # 取前两个特征进行二维绘图 y = iris.target # 绘制二维散点图 plt.scatter(X[:, 0], X[:, 1], c=y) plt.xlabel('Petal Length') plt.ylabel('Petal Width') plt.title('Iris Data Scatter Plot by Species') # 显示图像 plt.show() # 如果你想看三维散点图,可以类似地添加第三个特征 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值