libtorch学习历程（三）：模块与网络的编写与使用

最新推荐文章于 2025-07-12 15:10:21 发布

原创最新推荐文章于 2025-07-12 15:10:21 发布 · 560 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#学习 #网络

机器学习同时被 2 个专栏收录

24 篇文章

订阅专栏

libtorch

5 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

简介

想要在libtorch中搭建网络，模块化编程是十分重要，这与pytorch中的模块类似。都包含构造函数与一个前向传播函数forward，这两个函数是public的。

而模块中需要对使用的常用功能，如卷积层、激活函数，或使用的其他模块进行声明，声明为private。

函数与使用的层和模块在.h文件中进行声明，而函数的定义与层和模块的定义则在.cpp中的实现。

而且网络与模块一般会分开，这样使得代码更有调理，例如CNN网络与UNet网络所需模块都会在BaseModule.h与BaseModule.cpp中声明与定义，而CNN网络与UNet则会在各自的.h文件与.cpp文件中声明与实现，会调用模块。

代码结构

这里以一个简单的CNN网络为例进行编写。

CNN模块的声明与定义：

首先声明构造函数与forward函数，为public；然后声明需要使用的层，这里为conv与bn，为private。
并且对模块进行重命名，使用TORCH_MODULE(Module1Name)

// 声明模块
class ConvReluBnImpl  : public torch::nn::Module{
public:
	 ConvReluBnImpl(int input_channel=3, int output_channel=64, int kernel_size = 3, int stride = 1);// 构造函数，传入模块所需参数
	torch::Tensor forward(torch::Tensor x);// 前向传播
private:
	// 声明需要使用的层或其他功能
	torch::nn::Conv2d conv{nullptr};// 声明了一个卷积层
	torch::nn::BatchNorm2d bn{ nullptr };// 声明一个归一化层
	....
};
TORCH_MODULE(ConvReluBn);// 给上面的模块取别名，网络在调用模块时，使用这个名称来创建

接下来是定义与实现。
定义初始化函数时，需要将原本的指针对象conv进行赋值，传入参数，同时将其名称也确定。前向传播函数就和pytorch中的forward类似。

这里比较特别的是，由于使用了卷积层conv。若想要设置卷积层的参数，则需要传入一个Conv2dOptions对象，该对象中包含卷积层所需的参数。
因此这里编写了一个函数conv_options用于根据传入的参数获得一个Conv2dOptions对象，这个函数可以写在h或cpp文件。该函数不是必要的，可以直接传入对象

torch::nn::Conv2dOptions conv_options(int64_t in_planes, int64_t out_planes, int64_t kerner_size,
    int64_t stride = 1, int64_t padding = 0, bool with_bias = false) {
    torch::nn::Conv2dOptions conv_options = torch::nn::Conv2dOptions(in_planes, out_planes, kerner_size);
    conv_options.stride(stride);
    conv_options.padding(padding);
    conv_options.bias(with_bias);
    return conv_options;// 返回一个Conv2dOptions对象
}

// 构造函数对使用的对象进行命名与设置参数
ConvReluBnImpl::ConvReluBnImpl(int input_channel, int output_channel, int kernel_size, int stride) {
	// 传入一个conv_options
    conv = register_module("conv", 	torch::nn::Conv2d(conv_options(input_channel,output_channel,kernel_size,stride,kernel_size/2)));
    // 直接设置参数
    bn = register_module("bn", torch::nn::BatchNorm2d(output_channel));

}
// 
torch::Tensor ConvReluBnImpl::forward(torch::Tensor x) {
    x = torch::relu(conv->forward(x));// 显式调用forward函数
    x = bn(x);// 隐式调用forward函数，二者效果相同
    return x;
}

CNN网络的声明与实现

前面介绍了构建CNN的基本模块ConvReluBn，接下来尝试用c++搭建CNN模型。
该CNN由三个stage组成，每个stage由一个卷积层一个下采样层组成。这样相当于对原始输入图像进行了8倍下采样，输入->32->64->128->输出。

首先声明构造函数与forward函数，为public；然后声明需要使用的模块与层，为private。

class CNN : public torch::nn::Module{
public:
    CNN(int in_channels, int out_channels);// 构造函数
    torch::Tensor forward(torch::Tensor x);// 前向传播函数
private:
    int mid_channels[3] = {32,64,128};
    // 声明要使用的模块
    ConvReluBn conv1{nullptr};
    ConvReluBn down1{nullptr};
    ConvReluBn conv2{nullptr};
    ConvReluBn down2{nullptr};
    ConvReluBn conv3{nullptr};
    ConvReluBn down3{nullptr};
    // 声明要使用的层
    torch::nn::Conv2d out_conv{nullptr};
};

接下来是定义与实现。
在构造函数中，对各个模块与层进行初始化，并且进行重命名。
forward函数则组织各个模块与层的数据流动。

CNN::CNN(int in_channels, int out_channels){
	// 初始化
    conv1 = ConvReluBn(in_channels,mid_channels[0],3);
    down1 = ConvReluBn(mid_channels[0],mid_channels[0],3,2);
    conv2 = ConvReluBn(mid_channels[0],mid_channels[1],3);
    down2 = ConvReluBn(mid_channels[1],mid_channels[1],3,2);
    conv3 = ConvReluBn(mid_channels[1],mid_channels[2],3);
    down3 = ConvReluBn(mid_channels[2],mid_channels[2],3,2);
    out_conv = torch::nn::Conv2d(conv_options(mid_channels[2],out_channels,3));
	// 重命名
    conv1 = register_module("conv1",conv1);
    down1 = register_module("down1",down1);
    conv2 = register_module("conv2",conv2);
    down2 = register_module("down2",down2);
    conv3 = register_module("conv3",conv3);
    down3 = register_module("down3",down3);
    out_conv = register_module("out_conv",out_conv);
}
torch::Tensor CNN::forward(torch::Tensor x){
	// 控制数据的流动
    x = conv1->forward(x);
    x = down1->forward(x);
    x = conv2->forward(x);
    x = down2->forward(x);
    x = conv3->forward(x);
    x = down3->forward(x);
    x = out_conv->forward(x);
    return x;
}

训练网络

auto cnn = CNN(3,1);
auto cnn_input = torch::randint(255,{1,3,224,224});// 输入为一个包含三个通道的224x224的随机张量
torch::optim::Adam optimizer_cnn(cnn.parameters(), 0.0003);// 优化器，传入cnn网络的参数，学习率=0.003
auto cnn_target = torch::zeros({1,1,26,26});// 目标结果为一个包含一个通道的26x26的全0张量

for(int i=0; i<30;i++){ // 训练50次
	optimizer_cnn.zero_grad();// 梯度清零
	
	auto out = cnn.forward(cnn_input);// 输入传递
	auto loss = torch::mse_loss(out,cnn_target);// 计算损失
	loss.backward();// 损失反向传递
	
	optimizer_cnn.step();// 更新参数
	
	cout<<out[0][0][0];
}