💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在优快云上与你们相遇~💖
本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】
Sklearn 机器学习:IRIS 数据加载与认识数据
在开始任何机器学习项目之前,了解和熟悉数据是第一步。Iris(鸢尾花)数据集是机器学习入门的经典数据集之一。
本文将介绍如何使用 Scikit-learn 加载该数据集,并对其结构进行初步认识与探索分析。
🌸 一、Iris 数据集简介
Iris 数据集是由英国统计学家和生物学家 Ronald Fisher 于 1936 年收集的。数据集共包含 150 条记录,分别来自三种鸢尾花:Setosa、Versicolor 和 Virginica。
每条记录都有 4 个特征:
- 萼片长度(sepal length in cm)
- 萼片宽度(sepal width in cm)
- 花瓣长度(petal length in cm)
- 花瓣宽度(petal width in cm)
以及 1 个目标值(花的种类)。
🧪 二、加载 Iris 数据集
我们可以使用 sklearn.datasets
模块轻松加载该数据集。
from</