语义分割—交叉熵损失函数

最新推荐文章于 2024-09-22 22:17:54 发布

原创

最新推荐文章于 2024-09-22 22:17:54 发布 · 4.2k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#Pytorch #semantic segmentation #交叉熵

在语义分割中，关于目标标签的处理方式存在差异，有的代码需要使用squeeze，而有的则不需要。当标签是单通道灰度图时，通过DataLoader后的形状为（batch, w, h）。在某些实现中，transform或ToTensor步骤会增加一个维度。为确保正确性，应注意将target转换为long类型，并保持其三维形状（batch, w, h）。" 123162454,12409645,Java OA办公管理系统（SSM+Maven+layui）开发实战,"['Java开发', 'SSM框架', 'Maven构建', 'LayuiUI', 'OA系统']

from dataloaders import utils
criterion = utils.cross_entropy2d
 
import torch.nn as nn
def cross_entropy2d(logit, target, ignore_index=255, weight=None, size_average=True, batch_average=True):
    n, c, h, w = logit.size()
    # logit = logit.permute(0, 2, 3, 1)
    target = target.squeeze(1)
    if weight is None:
        criterion = nn.CrossEntropyLoss(weight=weight, ignore_index=ignore_index, size_average=False)
    else:
        criterion = nn.CrossEntropyLoss(weight=torch.from_numpy(np.array(weight)).float().cuda(), ignore_index=ignore_index, size_average=False)
    loss = criterion(logit, target.long())
 
    if size_average:
        loss /= (h * w)
 
    if batch_average:
        loss /= n
 
    return loss

最近发现一个问题，就是语义分割target这一步有的代码会将target.squeeze, 有的不需要呢我测试了一下如果标签单通道的灰度图的话 Image.open()读取是二维，然后经过DataLoader，就是三维（batch, w, h）, 不懂为啥要squeeze？？？？

原来在有的代码有的在transform中有的ToTe