Keras 入门课1 -- 用MLP识别mnist手写字符

这篇博客介绍了如何使用Keras构建一个多层感知机(MLP)模型来识别MNIST数据集的手写数字。首先,作者展示了如何导入Keras的相关模块,加载并预处理MNIST数据。接着,通过Sequential模型构建了包含两个隐藏层和一个输出层的网络,使用ReLU激活函数,并配置了损失函数、优化器和评估指标。然后,模型在训练集上进行了训练,并在验证集上评估了性能。最后,作者总结了本文的主要内容,包括Keras数据加载、模型构建、训练过程和效果评估。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

#Keras 入门课1: 使用Keras写一个mlp
本系列课程代码,欢迎star:
https://github.com/tsycnh/Keras-Tutorials

mlp就是multilayer perceptron,多层感知机。数据集用的是经典的mnist,数字分类问题。

首先导入keras的各种模块

keras.datasets 里面包含了多种常用数据集,如mnist,cifar10等等,可以实现自动下载和解析等等。

keras.models 里面有最核心的模型结构,如顺序模型结构Sequential

keras.layers 里面有一些常用的层结构,如全连接层Dense

keras.optimizers 里面有一些常用优化函数,如adam等

import keras
from keras.datasets import mnist 
from keras.models import Sequential 
from keras.layers import Dense,Dropout
from keras.optimizers import RMSprop
Using TensorFlow backend.
/usr/local/Cellar/python3/3.6.2/Frameworks/Python.framework/Versions/3.6/lib/python3.6/importlib/_bootstrap.py:205: RuntimeWarning: compiletime version 3.5 of module 'tensorflow.python.framework.fast_tensor_util' does not match runtime version 3.6
  return f(*args, **kwds)

载入mnist数据,第一次会自动下载,之后运行会载入本地文件。

(x_train,y_train),(x_test,y_test)=mnist.load_data()

↓查看一下数据格式,训练集一共有6万张,大小是28*28,单通道灰度图,测试集是1000张。标签是列向量

print(x_train.shape,y_train.shape)
print(x_test.shape,y_test.shape)
(60000, 28, 28) (60000,)
(10000, 28, 28) (10000,)

↓可视化一些图片

import matplotlib.pyplot as plt
im = plt.imshow(x_train
### 关于使用多层感知机(MLP)进行MNIST手写数字识别 #### 构建网络结构 为了完成MNIST手写数字的分类任务,可以构建一个多层感知机模型。该模型由三个主要部分组成:输入层、隐藏层以及输出层。 对于输入层而言,由于每张图片大小为28×28像素,因此共有784个节点作为输入特征向量[^2]。接着,在第一个隐藏层中设置了128个神经元来处理这些原始数据,并应用ReLU激活函数引入非线性特性。最后到达输出层时,则转换成具有10个单元的结果表示,分别对应着可能存在的十个类别标签即从0至9这十个阿拉伯数字[^3]。 ```python from keras.models import Sequential from keras.layers import Dense, Activation model = Sequential() model.add(Dense(128, activation='relu', input_shape=(784,))) model.add(Dense(10)) ``` #### 准备数据集 MNIST是一个广泛用于机器学习研究的标准数据库之一,它包含了大量黑白灰度的手绘字符样本。具体来说,整个集合被划分为两大部分——训练集与测试集;前者用来调整算法参数并评估其性能表现,后者则主要用于验证最终得到的学习成果是否具备良好的泛化能力。值得注意的是,这里提到的数据集中包含有60000幅尺寸均为28x28的小图供开发者们做实验之用[^1]。 ```python import numpy as np from tensorflow.keras.datasets import mnist (X_train, y_train), (X_test, y_test) = mnist.load_data() # 数据预处理 X_train = X_train.reshape((60000, 28 * 28)).astype('float32') / 255. X_test = X_test.reshape((10000, 28 * 28)).astype('float32') / 255. y_train = to_categorical(y_train) y_test = to_categorical(y_test) ``` #### 编译和训练模型 在编译阶段指定了交叉熵作为损失计算方式,同时还选择了Adam这一种自适应矩估计法来进行梯度下降优化操作。此外,也设定了准确率作为衡量指标以便后续观察模型收敛情况和发展趋势[^4]。 ```python model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy']) history = model.fit(X_train, y_train, batch_size=128, epochs=5, verbose=1, validation_split=.1) test_loss, test_acc = model.evaluate(X_test, y_test) print(f'Test accuracy: {test_acc}') ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值