无语义分割的场景多目标分类方法
在计算机视觉领域,场景中多目标的分类是一个具有挑战性的任务。传统的全局统计特征袋(BoF)表示在目标分类应用中展现出了一定的区分性和鲁棒性,但在处理具有背景杂波或多个共存类别的场景时,往往会遇到困难。下面将详细介绍一种无需显式检测和分割的多目标分类方法。
1. 背景与问题提出
传统的BoF方法在实际应用中存在局限性,尤其是当场景中存在背景杂波或多个共存类别时,这些方法常常失效。为了解决场景建模和多类别共存问题,一些方法借助检测或定位技术,但这种方法计算成本高,且对模型参数变化和环境变化敏感。还有一些图像标注方法旨在解决类似的多类别标注问题,但这些方法通常依赖于区域推理和标注,其可靠性在很大程度上取决于语义分割的准确性,而语义分割本身就是一个难题。
2. 提出的方法框架
为了解决上述问题,提出了一种将有偏采样策略与多实例多标签(MIML)学习和分类算法集成到BoF框架中的方法。具体步骤如下:
- 有偏采样策略 :利用先验概率分布对不同位置和尺度的图像块进行采样,该策略结合了自上而下的松散类先验和自下而上的图像显著性信息,以生成对特定类别对象有偏的采样结果。
- MIML学习与分类 :将每个类别的有偏采样结果的BoF表示视为一个实例,将图像视为实例的集合。通过MIML学习技术进行多目标分类,避免了语义分割的难题,同时保持了BoF表示的鲁棒性。
下面是该方法的流程图:
graph LR
A[训练数据] --> B[松散类
超级会员免费看
订阅专栏 解锁全文
3492

被折叠的 条评论
为什么被折叠?



