深度学习笔记（七）——基于Iris/MNIST数据集构建基础的分类网络算法实战

絮沫

已于 2024-01-16 02:48:17 修改

阅读量618

点赞数 11

分类专栏： DeepLearning 文章标签：算法深度学习笔记

于 2024-01-16 00:00:37 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_47407066/article/details/135610618

版权

本文详细介绍了在Tensorflow2.6.0中使用Keras构建神经网络的步骤，包括数据预处理、全连接层、卷积层的使用，以及如何通过Sequential和自定义类构建网络。文章还展示了如何设置训练参数和使用MNIST数据集进行分类网络训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文中程序以Tensorflow-2.6.0为例
部分概念包含笔者个人理解，如有遗漏或错误，欢迎评论或私信指正。
截图和程序部分引用自北京大学机器学习公开课

认识网络的构建结构

在神经网络的构建过程中，都避不开以下几个步骤：

导入网络和依赖模块
原始数据处理和清洗
加载训练和测试数据
构建网络结构，确定网络优化方法
将数据送入网络进行训练，同时判断预测效果
保存模型
部署算法，使用新的数据进行预测推理

使用Keras快速构建网络的必要API

在tensorflow2版本中将很多基础函数进行了二次封装，进一步急速了算法初期的构建实现。通过keras提供的很多高级API可以在较短的代码体量上实现网络功能。同时通过搭配tf中的基础功能函数可以实现各种不同类型的卷积和组合操作。正是这中高级API和底层元素及的操作大幅度的提升了tensorflow的自由程度和易用性。

常用网络

全连接层

tf.keras.layers.Dense(units=3, activation=tf.keras.activations.softmax, kernel_regularizer=tf.keras.regularizers.L2())

units：维数（神经元个数）
activation：激活函数，可选：relu softmax sigmoid tanh，这里记不住的话可以用tf.keras.activations.逐个查看
kernel_regularizer：正则化函数，同样的可以使用tf.keras.regularizers.逐个查看
全连接层是标准的神经元组成，更多被用在网络的后端或解码端（Decoder）用来输出预测数据。

拉伸层（维度展平）

tf.keras.layers.Flatten()

这个函数默认不需要输入参数，直接使用，它会将多维的数据按照每一行依次排开首尾连接变成一个一维的张量。通常在数据输入到全连接层之前使用。

卷积层

tf.keras.layers.Conv2D(filters=3, kernel_size=3, strides=1, padding='valid')

filters:卷积核个数
kernel_size：卷积核尺寸
strides：卷积核步长，卷积核是在原始数据上滑动遍历完成

最低0.47元/天解锁文章