基于VGG-16和LSTM的图像描述生成技术详解
1. VGG-16模型推理
1.1 推理概述
在构建好卷积神经网络(CNN)并定义好读取图像和创建批次的流程后,我们要使用从流程中读取的图像对CNN进行推理。推理即输入图像并获取预测结果(图像属于某类别的概率)。此过程从第一层开始,迭代至softmax层,该过程在 inference_cnn 函数中定义。
1.2 各层计算
- 获取权重和偏置 :
def inference_cnn(tf_inputs, device):
with tf.variable_scope('CNN'):
for si, scope in enumerate(TF_SCOPES):
with tf.variable_scope(scope,reuse=True) as sc:
weight, bias = tf.get_variable(TF_WEIGHTS_STR), tf.get_variable(TF_BIAS_STR)
- 卷积层输出计算 :
- 第一个卷积层:
h = tf.nn.relu(tf.nn.conv2d(tf_inputs
超级会员免费看
订阅专栏 解锁全文
56

被折叠的 条评论
为什么被折叠?



