Pytorch框架学习第七次作业——损失函数

最新推荐文章于 2024-02-12 07:47:03 发布

Aidanmomo

最新推荐文章于 2024-02-12 07:47:03 发布

阅读量258

点赞数

CC 4.0 BY-SA版权

分类专栏： Pytorch 文章标签： python pytorch

本文链接：https://blog.youkuaiyun.com/aidanmo/article/details/104255810

Pytorch 专栏收录该内容

26 篇文章

订阅专栏

本文深入探讨了PyTorch中CrossEntropyLoss的实现原理，通过逐步调试的方法，详细解析了从创建实例到继承自Module的过程。并介绍了loss function的三种reduction模式：none、sum和mean，以及它们在不同参数设置下的具体计算方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lossfunction依旧属于网络层的概念，即仍旧是Module的子类，为了对lossfunction有一个更清晰的概念，需要大家采用步进(Step into)的调试方法从loss_functoin = nn.CrossEntropyLoss() 语句进入函数，观察从nn.CrossEntropyLoss()到class Module(object)一共经历了哪些类，记录其中所有进入的类及函数。

第一步：CrossEntropyLoss类，super(CrossEntropyLoss, self).init
第二步：_WeightedLoss类，super(_WeightedLoss, self).init(size_average, reduce, reduction)
第三步: _Loss类，super(_Loss, self).init()
第四步：进入Module 类

损失函数的reduction有三种模式，它们的作用分别是什么？
当inputs和target及weight分别如以下参数时，reduction=’mean’模式时，loss是如何计算得到的？
inputs = torch.tensor([[1, 2], [1, 3], [1, 3]], dtype=torch.float)
target = torch.tensor([0, 1, 1], dtype=torch.long)
weights = torch.tensor([1, 2], dtype=torch.float)

none：逐个元素计算
sum：所有元素求和，返回标量
mean：加权平均，返回标量

    inputs = torch.tensor([[1, 2], [1, 3], [1, 3]], dtype=torch.float)
    target = torch.tensor([0, 1, 1], dtype=torch.long)
    # def loss function
    weights = torch.tensor([1, 2], dtype=torch.float)

    loss_f_none_w = nn.CrossEntropyLoss(weight=weights, reduction='none')
    loss_f_sum = nn.CrossEntropyLoss(weight=weights, reduction='sum')
    loss_f_mean = nn.CrossEntropyLoss(weight=weights, reduction='mean')

    # forward
    loss_none_w = loss_f_none_w(inputs, target)
    loss_sum = loss_f_sum(inputs, target)
    loss_mean = loss_f_mean(inputs, target)

    # view
    print("\nweights: ", weights)
    print(loss_none_w, loss_sum, loss_mean)