一些数据增强手段

薛定谔的智能

于 2021-07-15 11:51:20 发布

阅读量243

点赞数

分类专栏： numpy pytorch

本文链接：https://blog.youkuaiyun.com/fanzonghao/article/details/118756119

版权

数据增强 Mixup 损失函数贝塔分布模型泛化

关键词由优快云通过智能技术生成

numpy 同时被 2 个专栏收录

19 篇文章

订阅专栏

pytorch

14 篇文章

订阅专栏

该博客介绍了Mixup数据增强技术，通过在训练过程中混合样本及其标签，以生成新的训练数据点。它利用了贝塔分布随机生成的权重λ来线性组合两个样本的特征和标签。在计算损失时，也应用了这个权重，使得模型在训练中同时考虑原始和混合的目标。这种方法有助于模型泛化能力和鲁棒性的提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.mixup

def mixup_data(x, y, alpha=1.0, use_cuda=True):

    '''Compute the mixup data. Return mixed inputs, pairs of targets, and lambda'''
    if alpha > 0.:
        lam = np.random.beta(alpha, alpha)
    else:
        lam = 1.
    batch_size = x.size()[0]
    if use_cuda:
        index = torch.randperm(batch_size).cuda()
    else:
        index = torch.randperm(batch_size)

    mixed_x = lam * x + (1 - lam) * x[index,:]
    y_a, y_b = y, y[index]
    return mixed_x, y_a, y_b, lam

注意计算loss时候,加权一下

loss = lam * criterion(pred, y_a) + (1 - lam) * criterion(pred, y_b)

参考:其他一些别的.