图像检测算法综述

  1. 工作里面遇到的项目问题很多,总结大概就是不平衡分类问题和小样本检测问题。
  2. 不平衡分类问题的解决办法,大概是几个方面
    1. 数据增强方面
      1. 将数目多的样本进行聚类,找到比较有代表性的几个样本,去跟数目少的样本进行建模。
      2. 扩充不平衡样本数量,比如上采样,聚类生成数据。
      3. 分析原始数据性质,确定数据需不需要分类。
    2. 变量选取方面
      1. 用集成模型的办法,选取对目标纯度提升比较大的几个变量去建模。
    3. 模型建模方面
      1. 对数目少的样本,在进行损失计算的时候,给他们更大的权重。
  3. 小样本检测问题
    1. 数据角度
      1. 随机裁剪:通过裁剪图像,使小目标在裁剪后的图像中占据更大比例。
      2. 缩放:放大图像,使小目标更易检测。
      3. 旋转和翻转:增加数据多样性,提升模型泛化能力。
      4. 使用高分辨率的图片。
    2. 模型角度
      1. 如果不在乎模型速度,建议采用fasterrcnn这样的两阶段检测方法,比较容易能够获得高精度。
      2. 如果希望能够获得速度和精度的结合,可以采用yolo,unet类的单阶段检测办法。
        1. unet本质是一种先抽象再生成的模型,和强化学习、以及扩散模型在本质上有相似性。
          1. unet的结构是把图片首先进行卷积,卷积到一个很小的高层特征图上。
          2. 然后让这个特征图再上采样,扩散到一个大图上,然后输出一个检测头,去做我们想要的分割/目标检测任务。
          3. YOLO在UNET的基础上进行的改进就是在80*80,40*40,20*20的输出图上,都分别放了一个检测头,来适应不同尺度的目标。
          4. 通常来说,对于一个小目标物体,有的小目标物体是通过自身纹理来识别的,比如人体。  有的小目标物体是通过上下文来识别的,比如说人脸。所以你如果想提高目标检测的效果,就要先明确好你的目标的性质。如果是需要上下文的,就采用比较高层的特征图,因为高层特征图感受野大。如果是需要自身纹理的,就采用底层特征图,底层特征图感受野小。如果底层还不行,那么就采用更更底层的特征图去输出辨别。如果遇到需要上下文和自身纹理结合的,我自己采用过将底层和高层直接结合在一起,然后transformer的办法,效果一般。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值