15、简单神经网络的原理、应用与优化-优快云博客

本文链接：https://blog.youkuaiyun.com/web99/article/details/154807526

在处理数据集时，常常需要对数据进行归一化操作。以下是归一化的代码示例：

minimum = min(column)
for row_num in range(len(dataset)):
    dataset[row_num][col_num] = (dataset[row_num][col_num] - minimum) / (maximum - minimum)

这里的 dataset 是一个列表的列表，该函数会直接修改原始数据集，而不是返回一个转换后的副本。同时，程序假设数据集是由浮点数组成的二维列表。

经典的机器学习数据集中，鸢尾花数据集非常著名。它最初于 20 世纪 30 年代收集，包含 150 个鸢尾花样本，分为三个不同的物种，每个物种 50 个样本。每个样本有四个属性：萼片长度、萼片宽度、花瓣长度和花瓣宽度。

鸢尾花数据集存储在一个 CSV 文件中，示例数据如下：

5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa

每行代表一个数据点，前四个数字是四个属性，最后一个名称是鸢