Keras+CNN模型识别手写数字(mnist)详细分析

本文详细介绍了一种基于卷积神经网络(CNN)的手写数字识别模型,包括模型的构建、训练及结果分析过程。通过Python语言和TensorFlow、Keras库实现了模型,对MNIST数据集进行了有效识别,测试准确率达到99.12%。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

CNN模型

CNN卷积神经网络,包含卷积层(卷积运算提取输入的不同特征,更多层的网络能从低级特征中迭代提取等复杂的特征),线性整流层(RELU),池化层(卷积后会得到维度很大的特征,将特征切成几个区域,取最大值或平均值,得到新的较小维度特征),全连接层(局部特征结合变成全局特征,计算最后得分)

卷积:使用卷积核对图像进行扫描,得到特征图

 

池化:池化即下采样,目的减少特征图

详细内容参见:https://blog.youkuaiyun.com/liangchunjiang/article/details/79030681

 

实验内容 

加深对卷积神经网络模型的理解,能够使用卷积神经网络模型解决简单问题

根据卷积神经网络模型的相关知识,使用Python语言实现一个简单卷积神经网络模型,该模型能够实现手写数字识别。

代码详解

jupyter notebook

Python 3.7

TensorFlow 1.13

Keras 2.3.1

数据处理

from keras.datasets import mnist
from keras.utils import np_utils
import numpy as np 
import matplotlib.pyplot as plt
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
(x_train, y_train), (x_test, y_test) = mnist.load_data()
print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)

def plot_images(images, idx, num=10):
    fig = plt.gcf()
    for i in range(num):
        ax = plt.subplot(5, 2, 1+i)
        ax.imshow(images[idx+i], cmap='binary')
    plt.show()
plot_images(x_train, 0, 10)

x_train_nom = x_train.reshape(x_train.shape[0], 28, 28, 1).astype('float32')/255
x_test_nom = x_test.reshape(x_test.shape[0], 28, 28, 1).astype('float32')/255 

y_train1hot = np_utils.to_categorical(y_train)
print(y_train1hot[:3])

加载mnist数据集,并进行提取,plot_images函数用于展示图片

然后将图片数据reshape成四维,便于之后输入,然后除以255进行标准化处理

标签数据to_categorical转化为独热编码

 

构建模型

model = Sequential()

model.add(Conv2D(filters = 16,
                kernel_size=(3, 3),
                padding='same',
                activation='relu',
                input_shape=(28, 28, 1)))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Conv2D(filters=36,
                kernel_size = (3, 3),
                padding = 'same',
                activation = 'relu'))
model.add(MaxPooling2D(pool_size = (2, 2)))
model.add(Dropout(0.2))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.25))
model.add(Dense(10, activation = 'softmax'))

Sequential 建立线性堆叠模型,建立卷积层,filters卷积核个数16,kernel_size卷积核大小,input_shape输入图像大小,padding填充,activation激活函数

池化层池化窗口2

建立第一个卷积层,第一个池化层,再建立第二个卷积层,第二个池化层

加入 dropout防止过拟合

Flatten平坦层,将多维向量转化为一维向量

Dense隐藏层

最后加入输出层,一共10个神经元,表示十个类别,softmax来分类

 

模型训练

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
train_history = model.fit(x = x_train_nom,
                         y = y_train1hot,
                         epochs=10,
                         batch_size=64,
                         verbose=2,
                         validation_split=0.2)

进行模型编译和训练,epoch为10,batchsize为64,将训练数据的0.2作为验证集

 

结果分析

def show_train_history(train_history, train, validation):
    plt.plot(train_history.history[train])
    plt.plot(train_history.history[validation])
    plt.title('Train History')
    plt.ylabel(train)
    plt.xlabel('Epoch')
    plt.legend(['train', 'validation'], loc = 'upper left')
    plt.savefig(train)
    plt.show()
    
show_train_history(train_history, 'loss', 'val_loss')
show_train_history(train_history, 'accuracy', 'val_accuracy')

y_test1hot = np_utils.to_categorical(y_test)
scores = model.evaluate(x_test_nom, y_test1hot)
print(scores)

绘制准确率和loss的图像

输出得到测试准确率为 0.9912

from keras.utils import plot_model
plot_model(model, to_file = 'model1.png', show_shapes=True)

Keras可视化输出模型图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值