图像长尾分布(Long-Tail Distribution)问题

图像数据集中的长尾分布问题导致模型对少数类别(尾部类别)的识别能力下降。本文探讨了两种解决策略:重采样(如欠采样、过采样、类平衡采样)和重加权(如逆类别频率加权、Focal Loss、类平衡损失),旨在改善模型对尾部类别的学习,提高长尾分布数据集的分类性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

图像长尾分布(Long-Tail Distribution)问题

Long-tail distribution problem in image datasets.

ImageNetCOCO等常用视觉数据集中,由于经过人工预筛选,图像中的不同目标类别的数量是接近的。而在实际的视觉应用中,数据集大多服从长尾分布(long-tail distribution),即少数类别(称为head class)占据绝大多数样本,多数类别(称为tail class)仅有少量样本。一个典型的长尾分布数据集(Open Brands商标数据集)如下图所示。

定义数据集的**不平衡率(imbalance ratio)**为类别的最大数量和最小数量之比。目前常用的一些长尾分布数据集如下:

  • CIFAR100-LT:对CIFAR100的每类训练样本下采样得到的,不平衡率可以取
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI天才研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值