Tensorflow - CNN 卷积神经网络-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_27623521/article/details/77980781

　　在神经网络中加入CNN会大幅度提升代码的准确率。在之前的博客中有提到过分类，但那当时测试的最终得到的概率并不理想，这次我们换掉那个神经网络，使用CNN劵积神经网络，再跑一次分类看看效率如何。
　　这次使用的劵积结构是卷积层和最大池化层相互交替然后在最末端连接几层全连接层，看下图。
这里写图片描述
　　话不多说，上代码：

# coding:utf-8
import tensorflow as tf 
import input_data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

'''
这个demo 展示 在CNN 代码中怎么定义 Convolutional 的层和怎样进行 pooling.
实现一个基于MNIST数据集的例子. 提升代码的准确率。
'''

#定义Weight变量，输入shape，返回变量的参数。使用tf.truncted_normal产生随机变量来进行初始化
def weight_variable(shape): 
    initial = tf.truncated_normal(shape, stddev=0.1)
    return tf.Variable(initial)


#定义biase变量，输入shape ,返回变量的一些参数。使用tf.constant常量函数来进行初始化
def bias_variable(shape): 
    initial=tf.constant(0.1,shape=shape) 
    return tf.Variable(initial)


#定义卷积 x是图片的所有参数，W是此卷积层的权重
def conv2d(x,W):
    #tf.nn.conv2d函数是tensoflow里面的二维的卷积函数
    #定义步长strides=[1,1,1,1]值，strides[0]和strides[3]的两个1是默认值，
    #中间两个1代表padding时在x方向运动一步，y方向运动一步，padding采用的方式是SAME
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME') 

#定义池化
def max_pool_2x2(x):
    #采用的是最大值池化tf.max_pool()。池化的核函数大小为2x2，因此ksize=[1,2,2,1]，步长为2，因此strides=[1,2,2,1]
    return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')
#定义概率
def compute_accuracy(v_xs, v_ys):
    global prediction
    y_pre = sess.run(prediction, feed_dict={xs: v_xs, keep_drop: 1})#概率
    correct_prediction = tf.equal(tf.argmax(y_pre,1), tf.argmax(v_ys,1))#预测概率最大值和真实数据的差别
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))#计算这组数据有多少对的多少错的
    result = sess.run(accuracy, feed_dict={xs: v_xs, ys: v_ys, keep_drop: 1})#输出 百分比
    return result

#定义输入和过拟合
xs = tf.placeholder(tf.float32,[None,784]) #28*28
ys= tf.placeholder(tf.float32,[None,10])
keep_drop = tf.placeholder(tf.float32)

#处理 xs，把xs的形状变成[-1,28,28,1]
#-1代表先不考虑输入的图片例子多少这个维度，后面的1是channel的数量，因为我们输入的图片是黑白的，因此channel是1，
#如果是RGB图像，那么channel就是3。
x_image=tf.reshape(xs,[-1,28,28,1])

#建立劵积层
##-----------------第一层劵积 start----------------##
#定义第一层卷积的Weight
#本层的卷积核patch的大小是5x5，因为黑白图片channel是1所以输入是1，输出是32个featuremap
W_conv1=weight_variable([5,5,1,32])
#定义本测层的bias bias的大小是32个长度，因此我们传入它的shape为[32]
b_conv1=bias_variable([32])

#定义卷积神经网络的第一个卷积层 h_conv1
#对h_conv1进行激活函数来处理，这里用的是tf.nn.relu（修正线性单元）来处理。
#因为采用了SAME的padding方式，输出图片的大小没有变化依然是28x28，只是厚度变厚了，因此现在的输出大小就变成了
h_conv1=tf.nn.relu(conv2d(x_image,W_conv1)+b_conv1) #输出28x28x32

#进行pooling处理
h_pool1=max_pool_2x2(h_conv1) #输出14x14x32

##-----------------第二层劵积 start----------------##

#定义第二层劵积 Weight bias
#本层的输入就是上一层的输出，本层我们的卷积核patch的大小是5x5，有32个featuremap所以输入就是32，输出设定为64 

W_conv2=weight_variable([5,5,32,64])
b_conv2=bias_variable([64])
#定义卷积神经网络的第二个卷积层#
h_conv2=tf.nn.relu(conv2d(h_pool1,W_conv2)+b_conv2) #输出 14×14×64
h_pool2=max_pool_2x2(h_conv2)#输出 7×7×64

##-----------------全链接层 + dropout ---------------##

#将输出值从一个三维的变为一维的数据，-1表示先不考虑输入图片例子维度, 将上一个输出结果展平.
h_pool2_flat=tf.reshape(h_pool2,[-1,7*7*64])  # [n_samples,7,7,64] >>[n_samples,7*7*64]
# weight_variable的shape输入就是第二个卷积层展平了的输出大小
W_fc1=weight_variable([7*7*64,1024]) 
b_fc1=bias_variable([1024])

#将展平后的h_pool2_flat与本层的W_fc1相乘
h_fc1=tf.nn.relu(tf.matmul(h_pool2_flat,W_fc1)+b_fc1)
#处理过拟合
h_fc1_drop=tf.nn.dropout(h_fc1,keep_drop)

##-----------------全链接层2 + prediction----------------##
#进行最后一层的构建  输入是1024，最后的输出是10个[0-9]十个类
W_fc2=weight_variable([1024,10])
b_fc2=bias_variable([10])
#用softmax分类器 对输出进行分类
prediction = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)


# ---------------------------------------
#使用交叉熵损失函数 定义损失
cross_entropy=tf.reduce_mean(-tf.reduce_sum(ys*tf.log(prediction),reduction_indices=[1]))
# 用tf.train.AdamOptimizer()作为优化器进行优化，使cross_entropy最小
train_step=tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)

#初始化
init = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for i in range(1000):
        batch_xs, batch_ys = mnist.train.next_batch(100)
        sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys, keep_drop: 0.5})
        if i % 50 == 0:
            print(compute_accuracy(mnist.test.images[:1000], mnist.test.labels[:1000]))

运行测试
这里写图片描述
上面两个对比图，左边是使用了CNN的神经网络，右边是普通的神经网络，可以看出，准确率明显提升了，但是二者的耗时差距很大，因为我是在CPU上跑的，要提升速度，如果有GPU，建议使用GPU。