简单神经网络的原理、应用与优化
1. 数据归一化
在处理数据集时,常常需要对数据进行归一化操作。以下是归一化的代码示例:
minimum = min(column)
for row_num in range(len(dataset)):
dataset[row_num][col_num] = (dataset[row_num][col_num] - minimum) / (maximum - minimum)
这里的 dataset 是一个列表的列表,该函数会直接修改原始数据集,而不是返回一个转换后的副本。同时,程序假设数据集是由浮点数组成的二维列表。
2. 经典鸢尾花数据集
经典的机器学习数据集中,鸢尾花数据集非常著名。它最初于 20 世纪 30 年代收集,包含 150 个鸢尾花样本,分为三个不同的物种,每个物种 50 个样本。每个样本有四个属性:萼片长度、萼片宽度、花瓣长度和花瓣宽度。
鸢尾花数据集存储在一个 CSV 文件中,示例数据如下:
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
每行代表一个数据点,前四个数字是四个属性,最后一个名称是鸢
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



