Torch7入门续集（三）----Simple Layers的妙用

最新推荐文章于 2025-11-19 15:02:53 发布

原创

最新推荐文章于 2025-11-19 15:02:53 发布 · 5k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#torch7 #DL #torch

本文介绍了Torch7中的Simple Layers，包括Parameterized Modules如Dropout、Cosine，以及基本Tensor变换如Identity、Reshape/View。Simple Layers提供了一种便捷的方式在神经网络中添加常见操作，例如使用内置的Dropout进行正则化，用Cosine进行向量相似度计算。Reshape/View功能强大，View(-1)结合setNumInputDims(2)用于处理minibatch输入。

总说

先看一段代码，一般来说传入VGG的数据要先经过预处理，无非是先将BGR变成RGB，然后减去整个训练集的平均RGB值。写的最精简的可能是下面这样写。

function preprocess(img)
    local mean_pixel = torch.FloatTensor({
  
  103.939, 116.779, 123.68}):type(img:type())
    local perm = torch.LongTensor{
  
  3, 2, 1}
    img = img:index(1, perm):mul(255.0)
    mean_pixel = mean_pixel:view(3, 1, 1):expandAs(img)
    img:add(-1, mean_pixel)
    return img
end

然而。。请看下面的这种写法：

function getPreprocessConv()
    local mean_pixel = torch.Tensor({
  
  103.939, 116.779, 123.68})
    local conv = nn.SpatialConvolution(3,3, 1,1)
    conv.weight:zero()
    conv.weight[{
  
  1,3}] = 255
    conv.weight[{
  
  2,2}] = 255
    conv.weight[{
  
  3,1}] = 255
    conv.bias = -mean_pixel
    conv.gradBias = nil
    conv.gradWeight = nil
    conv.parameters = function() --[[nop]] end
    conv.accGradParameters = function() --[[nop]] end
    return conv
end

没错，直接用内置的卷积层进行操作！这启发我们一件事情：很多常见操作，我们都可以用内置的已有的各种层进行！而不是自己单独写，这就相当于nn层式编码！。。自创的词，大概知道就行。
Simple Layers就是一些常见的层操作，利用这些函数可以便捷的在某层后面加入各种操作层，这些操作层可以直接进行反向传播。

Simple Layers主要分为4个部分：
带参的Module—-> 基本Tensor变换——->数学Tensor运算——>其他Module
前面两篇写的就是Tensor和Math的，而在这里第二三正是利用这些简单层来替代Tensor变换和Math操作。