libtorch,torch::nn::Module类改变parameters值和buffers值，以及深拷贝

最新推荐文章于 2025-04-08 17:04:13 发布

rayyy9

最新推荐文章于 2025-04-08 17:04:13 发布

阅读量122

点赞数 2

分类专栏： torch 文章标签：人工智能 pytorch

本文链接：https://blog.youkuaiyun.com/reyyy/article/details/146518359

版权

torch 专栏收录该内容

21 篇文章

订阅专栏

#include <torch/torch.h>

// 定义一个继承自 torch::nn::Module 的 MLP 类
struct MLP : torch::nn::Module {
    // 构造函数
    MLP(int input_size, int output_size) {
        // 初始化线性层并注册为模块的参数
        fc = register_module("fc", torch::nn::Linear(input_size, output_size));
    }

    // 前向传播函数
    torch::Tensor forward(torch::Tensor x) {
        // 通过线性层传递输入张量
        x = fc->forward(x);
        return x;
    }

    // 线性层
    torch::nn::Linear fc{nullptr};
};

int main() {
    // 设置随机数种子以确保结果的可复现性
    torch::manual_seed(0);

    // 创建一个 MLP 实例，假设输入大小为 10，输出大小为 5
    MLP MyModule(10, 5);

    // 创建一个随机输入张量
    torch::Tensor input = torch::randn({1, 10});

    // 前向传播输入张量
    torch::Tensor output = MyModule.forward(input);

    // 打印输出张量
    std::cout << output << std::endl;

    // 打印模型的所有参数
    for (auto& parameter : MyModule.parameters()) {
        std::cout << parameter << std::endl;
    }

    return 0;
}

改变值

for (int i = 0; i < MyModule.parameters().size(); ++i) {
	MyModule.parameters()[i].data() = torch::rand({ 10, 5 });
}
for (int i = 0; i < MyModule.buffers().size(); ++i) {
	MyModule.buffers()[i].data() = torch::rand({ 10, 5 });
}

深拷贝如下

MLP MyModule_clone(10, 5);
for (int i = 0; i < MyModule.parameters().size(); ++i) {
	MyModule_clone.parameters()[i].data() = MyModule.parameters()[i].clone();
}
for (int i = 0; i < MyModule.buffers().size(); ++i) {
	MyModule_clone.buffers()[i].data() = MyModule.buffers()[i].clone();
}