机器学习与数据处理实战解析

最新推荐文章于 2025-12-17 18:47:30 发布

原创

最新推荐文章于 2025-12-17 18:47:30 发布 · 865 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 # 数据处理 # 鸢尾花数据集

1、编写一个程序来输出以下信息：1. 鸢尾花数据集中有多少个样本；2. 鸢尾花数据集中每个样本有多少个特征；3. 每个特征的值范围是多少。

以下是一个使用 Python 语言结合 sklearn 库来解决该问题的示例代码：

from sklearn import datasets
import numpy as np

# 加载鸢尾花数据集
iris = datasets.load_iris()

# 1. 输出样本数量
num_samples = len(iris.data)
print(f'鸢尾花数据集中的样本数量: {num_samples}')

# 2. 输出每个样本的特征数量
num_features = iris.data.shape[1]
print(f'每个样本的特征数量: {num_features}')

# 3. 输出每个特征的值范围
for i in range(num_features):
    feature_min = np.min(iris.data[:, i])
    feature_max = np.max(iris.data[:, i])
    print(f'特征 {i + 1} 的值范围: [{feature_min}, {feature_max}]')

上述代码首先加载鸢尾花数据集，然后分别计算并输出样本数量、每个样本的特征数量以及每个特征的值范围。

2、分别找出鸢尾花数据集分类问题和目标检测任务的特征和标签

鸢尾花数据集分类问题 ：
- 特征：萼片长度、萼片宽度、花瓣长度、花瓣宽度
- 标签：鸢尾花的类别（如鸢尾花setosa、鸢尾花versicolor、鸢尾花virginica，可用1、2、3表示）
目标检测任务 ：
- 特征：与图像相关的像素值等
- 标签：一组边界框，包含分类标签以及边界框的大小、在图像中的坐标等信息