【Tensorflow】TensorFlow2.0神经网络基础_tensorflow2.0 神经网络-优快云博客

本文链接：https://blog.youkuaiyun.com/ARPOSPF/article/details/122786407

本文介绍了TensorFlow2.0中神经网络的基础知识，包括前向传播算法、数据加载、全连接神经网络的构建以及误差计算方法。讲解了如何使用tf.keras.layers.Dense创建全连接层，利用tf.data.Dataset处理数据集，并探讨了损失函数如MSE和CrossEntropy。此外，还提及了变量的使用和初始化，以及参数更新的关键角色。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

0. 前向传播算法简介

计算神经网络的前向传播结果需要三部分信息：

神经网络的输入，这个输入就是从实体中提取的特征向量
神经网络的连接结构，神经网络是由神经元构成的，神经网络的结构给出不同神经元之间输入输出的连接关系。
每个神经元中的参数。

1. 数据加载

TensorFlow依托Keras，预先封装了很多小型的数据集，可以通过接口下载并使用该数据集。包含boston_housing（波士顿房价回归预测数据集）、cifar10（Cifar图像分类数据集共10大类）、cifar100（Cifar图像分类数据集共100小类）、mnist（手写数字识别数据集）、fashion_mnist（常用品分类数据集）、imdb（电影情感评论文本分类数据集）。

调用load_data方法TensorFlow会自动从Google下载暂存的数据集到本地（第一次运行，后面不再下载，需要科学上网），然后以numpy格式返回训练集和测试集的x和y。

示例
TensorFlow数据加载
（1）tf.data.Dataset

在TensorFlow中，data模块中的Dataset是一个很重要的对象，作为数据加载的接口。
Dataset对象的form_tensor_slices方法可以很方便地从numpy矩阵等加载数据并进行预处理
（注意Dataset对象的使用必须先取得对应的迭代器）。
示例
Dataset对象的shuffle方法可以很方便地打散数据（特征和标签同步打散），一般只需要一个buffer_size参数，该数值越大，混乱程度越大。
Dataset对象的map方法可以很方便地进行数据预处理或者数据增广的操作，其功能类似于Python的map方法，传入一个函数对象，对每个数据调用该函数进行处理。
Dataset对象的batch方法可以直接设定每次取出数据的batch_size（默认为1），这是最核心的功能。
Dataset对象的repeat方法可以指定迭代器迭代的次数（在Python中对可迭代对象一旦取完就会停止取数据，但是训练往往需要很多轮次），默认不指定repeat的参数则会一直迭代下去。

2. 全连接神经网络

经典的神经网络结构是由多个隐藏层的神经元级联形成的全连接神经网络，后来各类针对不同任务的神经网络结构的设计都是基于全连接神经网络的思路，如计算机视觉的卷积神经网络、自然语言处理的循环神经网络等。对于全连接神经元的神经网络，由于结构固定，已经做了一定程度的封装。

（1）tf.keras.layers.Dense(units)
可以创建包含参数 $w$ 和偏置 $b$ 的一层全连接层网络，units表示神经元的数目。注意在创建Dense对象后，weights参数是默认没有创建的，需要通过build方法创建，使用net实例进行运算时会自动检查参数，若没有创建，则依据参与运算的数据自动创建weights。
Dense
（2）tf.keras.Sequential
Sequential是用于线性堆叠多层网络结构的一个基础容器，其会自动将输入的张量流过多层得到输出。

3. 误差计算

（1）MSE均方差
均方误差的计算公式为：
$\frac{1}{N}\sum {(y-out)^2}$
在TensorFlow中对这类简单的误差函数（损失函数）进行了简单封装。MSE这类损失函数一般都要除以一个样本量N，以保证求得的梯度值不会太大。
MSE均方误差
（2）CrossEntropy交叉熵
计算公式为：
$-\sum p(x) \log{q(x)}$
预测的 $q$ 分布尽量逼近于真实的 $p$ 分布，此时交叉熵函数值最小，故优化该损失函数合理。在TensorFlow中，对交叉熵函数计算进行了封装。