论文作者:Shani Gamrian,Hila Barel,Feiran Li,Masakazu Yoshimura,Daisuke Iso
作者单位:Sony AI ;Sony Group Corporation
论文链接:http://arxiv.org/abs/2503.13163v1
内容简介:
1)方向:目标检测
2)应用:目标检测
3)背景:传统的目标检测模型通常应用于标准的RGB图像,这些图像通过图像信号处理(ISP)管道进行处理,以增强传感器捕获的RAW图像。然而,ISP函数可能会丢失一些对于计算机视觉任务(如目标检测)至关重要的信息。
4)方法:本文提出的RAM模块替代了传统的ISP,针对RAW目标检测进行了专门优化。RAM灵感来源于人类视觉系统的并行处理机制,与现有的学习型ISP方法不同,它通过并行应用多个ISP函数,而不是顺序执行,从而更全面地捕捉图像特征。然后,这些处理后的表示通过一个专门的模块进行融合,动态集成并优化信息,以适应特定任务的需求。
5)结果:该方法不仅充分发挥了RAW传感器数据的潜力,还实现了任务特定的预处理,显著提高了目标检测性能。在多种RAW图像数据集上,尤其是在不同光照条件和动态范围下,该方法超越了基于RGB的方法,达到了最先进的检测效果。