使用WeightedRandomSampler处理类不平衡(PyTorch)

本文探讨了在深度学习中如何使用PyTorch解决类别不平衡问题,并通过具体实例介绍了WeightedRandomSampler的使用方法。

参考博客:

博客一:Address class imbalance easily with Pytorch | by Mastafa Foufa | Analytics Vidhya | Medium

播客二:Address class imbalance easily with Pytorch Part 2 | by Mastafa Foufa | Towards Data Science

类不平衡

论文所给出的结论,处理类不平衡的主要方法是过采样。过采样应被应用至完全消除类不平衡,而优化的欠采样系数取决于不平衡的程度。与一些经典的机器学习模型不同,过采样不会导致CNN网络过拟合

假设数据集中包含两类: c l a s s 1 class_1 class1 c l a s s 2 class_2 class2,基于均匀分布,那么从 c l a s s 1 class_1 class1中随机采样得到的概率为
p ( x ∈ c l a s s i ) = # { c l a s s i } # { t r a i n } = N c l a s s i N t r a i n p(x\in class_i)=\frac{\#\{class_i\}}{\#\{train\}}=\frac{N_{class_i}}{N_{train}} p(xclassi)=#{ train}#{ classi}=NtrainNclassi

但是,实际可能二分类中,某一类数量远大于另一类
N c l a s s 1 ≫ N c l a s s 2 N_{class_1} \gg N_{class_2} N

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值