MNIST手写数字识别 |李宏毅机器学习【8】

本文介绍了通过keras实现MNIST手写数字识别的步骤,包括模型定义、优化器选择和训练策略。讨论了SGD与Mini-batch的区别,并给出了训练深度神经网络的实用技巧,如激活函数选择、防止过拟合的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习编程语言时,我们学的第一个问题都是输出“hello world”,毫不夸张的说,MNIST就是深度学习版的“hello word”。这节课将通过keras实现MNIST手写数字识别这个经典案例,并且在实践过程中总结深度学习调参的一般套路。

一、利用keras进行深度学习的一般步骤

step1: define a set of function

这一步决定神经网络的结构,也是编写程序最重要的一步。常用的参数包括神经网络的层数,每一层神经元个数,激活函数的选择等等。常见的激活函数在下图中已列出。

step 2: goodness of function

这一步要定义合适的损失函数,以及相应accuracy(optimazer指定求解的方法,归入第三步)。

step 3: pick the best function

选定optimezer,实际上是选择梯度下降的各种方法。之后需选择batch_size和no_epoch,决定神经网络训练的batch大小和训练的轮数。

模型训练完成后,就可以用来测试啦。这里有两种测试情境,一种是带标记的(evaluate),一种是不带标记的(predict)。

一个batch是进行一次参数更新所需的样本子集,将所有batch都训练完的一轮就是一个epoch。

二、SG

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值