6、TensorFlow基础与模型训练

a1b2c3d

于 2025-07-15 10:40:26 发布

阅读量22

点赞数

CC 4.0 BY-SA版权

分类专栏： TensorFlow 2实战计算机视觉精要文章标签： TensorFlow 模型训练张量

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/a1b2c3d/article/details/150060757

TensorFlow 2实战计算机视觉精要专栏收录该内容

30 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

TensorFlow基础与模型训练

1. 模型训练基础

在模型训练过程中，有几个关键的概念和操作。首先是损失函数的选择， sparse_categorical_crossentropy 和 categorical_crossentropy 都执行交叉熵操作，但前者直接接受真实标签作为输入，而后者要求真实标签提前进行one - hot编码。使用 sparse_categorical_crossentropy 可以避免手动转换标签。

在优化器方面，传递 'sgd' 给Keras等同于传递 tf.keras.optimizers.SGD() 。前者更易读，后者则可以指定自定义学习率等参数。损失函数、评估指标以及传递给Keras方法的大多数参数都遵循这个规则。

训练模型时，我们调用 .fit() 方法，它与另一个流行的机器学习库scikit - learn的接口非常相似。这里我们训练5个周期，即对整个训练数据集迭代5次。设置 verbose 为1，这样可以得到一个进度条，显示之前选择的评估指标、损失值和预计到达时间（ETA）。

模型性能方面，我们会发现模型存在过拟合现象，即训练准确率高于测试准确率。经过5个周期的训练，测试集准确率达到97%，比之前提高了约2%，但与最先进的算法99.79%的准确率仍有差距。

整个训练过程主要包括以下三个步骤：
1. 数据加载 ：本次数据已可用，但在未来项目中，可

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。