【计算机视觉 | 目标检测】干货:目标检测常见算法介绍合集(四)

本文概述了多项先进的目标检测技术,包括用于公式检测的ScanSSD,单阶段目标检测的RetinaMask,模仿人眼视觉的CornerNet-Saccade,以及关键点检测的CentripetalNet等。FastFocalDetectionNetwork和CornerNet-Squeeze通过优化结构提升效率,而PaddleAnchorFreeNetwork则展示了无锚点检测的潜力。最后,讨论了HumanRobotInteractionPipeline在人机交互中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

四十六、Parallel Feature Pyramid Network

四十七、ScanSSD

ScanSSD 是一种单次检测器 (SSD),用于定位偏离文本并嵌入文本行的数学公式。 它仅使用视觉特征进行检测:不使用布局、字体或字符标签等格式或排版信息。 给定 600 dpi 文档页面图像,单次检测器 (SSD) 使用滑动窗口在多个尺度上定位公式,然后汇集候选检测以获得页面级结果。

在这里插入图片描述

四十七、RetinaMask

RetinaMask 是一种单阶段目标检测方法,通过在训练期间添加实例掩模预测任务以及提高训练期间参数选择鲁棒性的自适应损失来改进 RetinaNet,并在训练中包含更困难的示例。

在这里插入图片描述

四十八、CornerNet-Saccade

CornerNet-Saccade 是 CornerNet 的扩展,具有类似于人类视觉中的眼跳的注意力机制。 它从缩小的完整图像开始,生成注意力图,然后放大并由模型进一步处理。 这与原始 CornerNet 的不同之处在于它在多个尺度上完全卷积应用。

在这里插入图片描述

四十九、CentripetalNet

CentripetalNet 是一种基于关键点的检测器,它使用向心位移来配对来自同一实例的角点关键点。 CentripetalNet 预测角点的位置和向心偏移,并匹配偏移结果对齐的角点。

在这里插入图片描述

五十、Fast Focal Detection Network

F2DNet,一种新颖的两级目标检测架构,通过用焦点检测网络替换区域提议网络以及用快速抑制头替换边界框头,消除了经典两级检测器的冗余。

在这里插入图片描述

五十一、CornerNet-Squeeze

CornerNet-Squeeze 是一种物体检测器,它通过新的紧凑沙漏架构扩展了 CornerNet,该架构利用了具有深度可分离卷积的火模块。

在这里插入图片描述

五十二、Paddle Anchor Free Network

PAFNet是一种用于目标检测的无锚点检测器,去除预定义的锚点并直接对位置进行回归,可以实现更高的效率。 整个网络由主干、上采样模块、AGS模块、定位分支和回归分支组成。 具体来说,服务器端选择ResNet50-vd作为骨干网,移动端选择MobileNetV3。 此外,对于移动端,我们用精简卷积算子替换了传统的卷积层。

在这里插入图片描述

五十三、Human Robot Interaction Pipeline

我们提出的流程由三个部分组成:1)识别交互类型; 2)检测交互所针对的对象; 3)从机器人传感器记录的数据中逐步学习模型。 我们的主要贡献在于由已识别的交互引导的目标对象检测以及增量对象学习。 我们方法的新颖之处在于关注自然、异构和多模式 HRI 来逐步学习新的对象模型。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值