💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在优快云上与你们相遇~💖
本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】
Sklearn 机器学习 IRIS 数据集拆分训练测试集详解
在机器学习中,模型评估离不开合理的数据集划分。通常我们会将数据划分为训练集(Training Set)和测试集(Testing Set)。本文将结合 sklearn 的经典 IRIS 鸢尾花数据集,讲解如何完成数据的加载与拆分操作。
🌸 一、IRIS 数据集简介
IRIS 数据集是机器学习中最著名的入门数据集之一,由英国统计学家 Ronald Fisher 在 1936 年提出。该数据集包含:
-
150 条记录
-
每条记录有 4 个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度)
-
对应的标签有 3 个类别:
- Setosa
- Versicolor
- Virginica
该数据集已经被 sklearn 内置,可以直