深度学习基础 - MNIST实验（tensorflow+MLP）

最新推荐文章于 2025-05-17 13:29:43 发布

原创

最新推荐文章于 2025-05-17 13:29:43 发布 · 2.1k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #mnist #tensorflow #MLP #Dropout

本文采用多层感知机（MLP）模型进行MNIST手写数字分类任务，探讨了Adam优化器和Dropout正则化的应用。通过实验，发现优化策略和正则化能有效提升模型性能，最终训练精度达到99.7%，测试精度约为97%。未来将对比CNN与MLP的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

采用MLP（多层感知机）模型进行mnist分类任务，尝试Adam、Dropout等训练策略。

本文的完整代码托管在我的Github PnYuan - Practice-of-Machine-Learning - MNIST_tensorflow_demo，欢迎交流。

1.任务背景

在前一篇深度学习基础 - MNIST实验（tensorflow+Softmax）的基础上，我们进一步引入MLP（multi-layer perceptron - 多层感知机）来进行mnist实验，以期实现更好的识别效果。

关于mnist数据集的相关基础信息可参考前一篇文章或MNIST官网。

2.实验过程

实验参考代码：python + tensorflow

2.1.MLP建模

这里，MLP用于MNIST分类实验，输入是x - 28×28=784的图片灰度向量，输出是类别标签y ~ [0,1,2,...,9]，拟构建的MLP（全连接NN）模型如下图示：

mlp_graph

这里我们从一个无隐含层模型（即Softmax）开始，逐渐增加神经网络规模，来观察效果变化情况。

为适应任意层数和层内神经元节点数的开发需求，编写参数初始化和前向传播函数如下：

'''(MLP) parameter initial'''
def mlp_param_init(dim):
    """
    @note: Initializes parameters to

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Snoopy_Yuan

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

深度学习基础 - MNIST实验（tensorflow+CNN）

Snoopy_Yuan技术部落格

03-17

2531

深度学习基础 - MNIST实验（Tensorflow-CNN）本文的完整代码托管在我的Github PnYuan - Practice-of-Machine-Learning - MNIST_tensorflow_demo，欢迎交流。 1.任务背景这里，我们拟通过搭建卷积神经网络（CNN）来完成MNIST手写数字识别任务，关于MNIST任务的相关内容可参考前文深度学习基础 - ...

深度学习基础 - MNIST实验（tensorflow+Softmax）

Snoopy_Yuan技术部落格

03-15

1087

基于tensorflow开发框架，搭建softmax模型完成mnist分类任务。本文的完整代码托管在我的Github PnYuan - Practice-of-Machine-Learning - MNIST_tensorflow_demo，欢迎访问。 1.任务背景 1.1.目的以MNIST手写数字识别为课题，研究基本深度学习方法的应用。本文先从Softmax模型切入，以熟悉t...

参与评论您还未登录，请先登录后发表或查看评论

神经网络深度学习+MNIST数字识别实验报告

06-20

神经网络深度学习+MNIST数字识别实验报告，包含完整实验报告+代码实现

【TensorFlow-MLP】MNIST

bryant_meng

07-31

1591

文章目录1 database1.1 下载数据集1.2 查看training data1.3 显示图形1.4 查看label1.5 查看validation1.6 查看test1.7 批次读取MINIST数据2 Build Model2.1 定义layer函数2.2 用layer函数建立模型2.3 定义训练方式2.4 定义模型的准确率的方式3 Training process3.1 参数设置3.2 ...

前馈神经网络（MLP）详解

最新发布

qq_43664407的博客

05-17

1229

，输出层根据任务选择（如分类用Softmax）。Transformer中的。前馈神经网络（MLP）由。在残差块中，MLP用于。组成，每层全连接。

TensorFlow教程02：针对机器学习初学者的MNIST实验——Softmax回归

北方大冬瓜的博客

05-03

4300

TensorFlow实现MNIST多层感知机(MLP)

XerCis的博客

03-06

1479

一、代码 # coding=utf-8 import tensorflow as tf import tensorflow.contrib.layers as layers from tensorflow.examples.tutorials.mnist import input_data # 数据集 mnist = input_data.read_data_sets("/tmp/data/",...

MLP-for-MNIST-Hand-writtern-Digits-Classification

03-14

综上所述，"MLP-for-MNIST-Hand-writtern-Digits-Classification"项目涉及了深度学习的基础知识，包括多层感知器模型的构建、训练、评估以及Python编程和相关库的使用，是机器学习初学者和实践者常用来入门和提升...

Python 开发（27）：深度学习基础 - 使用 TensorFlow 和 Keras

一名热衷于技术的全栈开发者，专注于前端与后端的全面技术探索。在这里，我将分享我在技术领域的学习与成长，助力更多开发者的进步。

11-19

1468

随着人工智能的迅猛发展，深度学习已成为解决复杂问题的核心技术之一。TensorFlow 和 Keras 是目前最受欢迎的深度学习框架组合，为开发者提供了高效、灵活的工具链。本文将以通俗易懂的方式介绍深度学习的基本概念，结合 TensorFlow 和 Keras 实现简单的深度学习模型。下一步，可以尝试构建自己的深度学习应用，如聊天机器人或图像生成模型，挑战更复杂的任务！如果你对深度学习框架或代码实现有任何疑问，欢迎在评论区留言或一起探讨！它们的结合让开发者既可以快速开发原型，又能在需要时优化底层性能。

用tensorflow做实验

EpicG的博客

10-25

422

在做上一篇论文的实验时由于不善于总结，曾遇到的错误在这一次实验中又发生了不少，为了避免一而再的踩坑，记录一下这次实验总结出的用tensorflow训练的技巧。关于loss 做深度学习实验，通过loss值的收敛情况观察训练效果是最直接的方法，以下有几种可能遇到的loss值不收敛问题，通过观察loss值和准确率的改变进行区分： loss值持续变化（但不收敛），准确率不提高 a.网络复杂度不够，需要增...

MNIST MLP-Net pytorch

curme_miller的博客

05-25

379

MNIST数据集有70,000张图片,其中训练集有60,000张,而测试集有10,000张.

基于Python的MNIST解析图片文件和标签文件实验报告

毕业作品网站

09-15

659

实验环境：系统：windows10。

TensorFlow实验（1）

weixin_45626468的博客

03-29

693

实验1-2 搭建深度学习开发环境 1）安装Anaconda 2）创建虚拟环境： 3）激活环境 4）安装tensorflow 5)安装jupyter notebook 安装完成之后，运行第一个程序“Hello,World” 要求：详细安装步骤，步骤截图，以及程序运行截图 1）安装Anaconda 可在清华镜像站（https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/）下载，如下图：下载完毕后，双击开始安装等待一小段时.

TensorFlow基础实验

weixin_43657927的博客

06-13

718

1. 实验目标初步认识 ????????????????????????????????????????库的用途初步学习 ????????????????????????????????????????数据的操作 2. 实验内容描述 2.1 本次实验主要使用的 ????????????ℎ????????库 | 名称 | 简介 | | ???????????????????? | 数组运算、矩阵运算、生成随机数 |

李宏毅课程mnist源代码和实现小实验（keras框架）

橘露源的博客

04-03

2264

需要下载keras框架！大概解释下整体过程： 1.定义下载数据的函数 load_data(),在网络上进行下载训练集和测试集文件。 2.定义神经网络模型输入维数：图片是28 *28，共10000张，则输入维数是10000 * 784；输出维数：九种数字类型，那么输出维数是10000 * 10；神经网络层数：根据自己的需要进行设定；每层神经元的：同上激活函数：这里用的是sigmoi...

MNIST手写体识别/使用面向对象的方法设计训练和推理程序MLP

wangzhengyang214的博客

07-13

705

掌握神经网络的设计原理，熟练掌握神经网络的训练和推断方法，能够使用 Python 语言实现一个三层全连接神经网络模型对手写数字分类的训练和使用。1)实现三层神经网络模型进行手写数字分类，建立一个简单而完整的神经网络工程。通过本实验理解神经网络中基本模块的作用和模块间的关系，为后续建立更复杂的神经网络(如风格迁移)奠定基础。2)利用高级编程语言 Python 实现神经网络基本单元的前向传播(正向传播)和反向传。

tensorflow MLP

BrownWong的专栏

02-01

1238

多层感知机分类# -*- coding: utf-8 -*- import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data import matplotlib.pyplot as plt # 获得训练数据 mnist = input_data.read_data_sets("MNIST_data/

基于Python实现的MLP for MNIST实验

毕业作品网站

09-21

743

本实验尝试了多种超参数配置下的 MLP 在 MNIST 数据集上的效果，并尝试使用自动编码技机对输入进行预处理。本实验使用 Keras 编写神经网络代码，使用 tensorflow 作为 backend。数据集分割方面直接调用老师给的数据集获取函数，训练集被分割成 50000 规模的训练集和 10000 规模的验证集。多种超参数配置下 MLP 在 MNIST 上的效果。

MNIST手写数字识别之MLP实现