图像检测算法综述

芬达橙味儿汽水

于 2025-03-06 14:09:35 发布

阅读量305

点赞数 8

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_35828352/article/details/146067380

版权

工作里面遇到的项目问题很多，总结大概就是不平衡分类问题和小样本检测问题。
不平衡分类问题的解决办法，大概是几个方面
1. 数据增强方面
  1. 将数目多的样本进行聚类，找到比较有代表性的几个样本，去跟数目少的样本进行建模。
  2. 扩充不平衡样本数量，比如上采样，聚类生成数据。
  3. 分析原始数据性质，确定数据需不需要分类。
2. 变量选取方面
  1. 用集成模型的办法，选取对目标纯度提升比较大的几个变量去建模。
3. 模型建模方面
  1. 对数目少的样本，在进行损失计算的时候，给他们更大的权重。
小样本检测问题
1. 数据角度
  1. 随机裁剪：通过裁剪图像，使小目标在裁剪后的图像中占据更大比例。
  2. 缩放：放大图像，使小目标更易检测。
  3. 旋转和翻转：增加数据多样性，提升模型泛化能力。
  4. 使用高分辨率的图片。
2. 模型角度
  1. 如果不在乎模型速度，建议采用fasterrcnn这样的两阶段检测方法，比较容易能够获得高精度。
  2. 如果希望能够获得速度和精度的结合，可以采用yolo,unet类的单阶段检测办法。
    1. unet本质是一种先抽象再生成的模型，和强化学习、以及扩散模型在本质上有相似性。
      1. unet的结构是把图片首先进行卷积，卷积到一个很小的高层特征图上。
      2. 然后让这个特征图再上采样，扩散到一个大图上，然后输出一个检测头，去做我们想要的分割/目标检测任务。
      3. YOLO在UNET的基础上进行的改进就是在80*80，40*40，20*20的输出图上，都分别放了一个检测头，来适应不同尺度的目标。
      4. 通常来说，对于一个小目标物体，有的小目标物体是通过自身纹理来识别的，比如人体。有的小目标物体是通过上下文来识别的，比如说人脸。所以你如果想提高目标检测的效果，就要先明确好你的目标的性质。如果是需要上下文的，就采用比较高层的特征图，因为高层特征图感受野大。如果是需要自身纹理的，就采用底层特征图，底层特征图感受野小。如果底层还不行，那么就采用更更底层的特征图去输出辨别。如果遇到需要上下文和自身纹理结合的，我自己采用过将底层和高层直接结合在一起，然后transformer的办法，效果一般。

芬达橙味儿汽水

博客等级

码龄9年

16
原创

66
点赞

71
收藏

57
粉丝

关注

私信

热门文章

分类专栏

sss 1篇

展开全部收起

最新评论

基于tensorRT-Alpha,部署YOLOV8模型
芬达橙味儿汽水: 不好意思没看到
基于tensorRT-Alpha,部署YOLOV8模型
m0_53312305: 可以请教一下吗，我遇见一点错误，可以给与一定的知识付出
python opencv解决中文文件名读不了的问题
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
python opencv解决中文文件名读不了的问题
优快云-Ada助手: 恭喜作者发布了第8篇博客！解决python opencv中文文件名读取问题的文章对我们这些遇到同样困扰的读者来说真是及时雨。希望作者能继续分享更多关于python opencv的经验和技巧，或许可以考虑分享一些实际案例或者深入解读opencv的相关知识，期待作者的下一篇作品！愿您在创作的道路上越走越远，加油！
cuda_gdb使用
优快云-Ada助手: 恭喜您发布了新的博客《cuda_gdb使用》，内容相信会对很多读者有所帮助。希望您能继续保持写作的热情和坚持，为大家分享更多有趣和有用的内容。也建议您可以尝试写一些关于CUDA编程的技巧或者实战经验分享，这样可以让读者更深入地了解这方面的知识。期待您的下一篇作品！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。