正则与小目标检测及零样本学习技术的突破
在计算机视觉和机器学习领域,正则与小目标检测以及零样本学习是两个重要的研究方向。下面将详细介绍相关的技术和方法,以及它们在实际应用中的表现。
正则与小目标检测技术
在目标检测任务中,传统方法往往只能检测目标,而在实际应用里,识别目标同样重要。为解决这一问题,研究人员设计了基于 Faster R - CNN 的正则与小目标检测方法(RSTD)。
RSTD 以 Faster R - CNN 为基础框架,其架构主要分为两个阶段:
1. 特征提取与区域生成 :利用基础 CNN(如 VGG 或 ResNet)提取输入图像的特征图,通过区域提议网络(RPN)生成区域提议 Ro。接着,引入正则与小目标特征提取层,输出 Ro、关注背景信息的 Rb 和关注关键信息的 Ri。
2. 特征融合与分类 :将扩展后的区域送入 RoI - pooling 部分,得到特征图 Fo、Fb、Fi。将它们在通道上拼接,并通过卷积层压缩通道大小,最后送入卷积层进行分类。
RSTD 还分为 2 分支和 3 分支结构。2 分支结构主要关注背景信息,而 3 分支结构在此基础上还关注内部关键信息。
为了提取正则与小目标的特征,研究人员设计了正则与小目标特征提取层。对于输入图像 I(w, h),经 CNN 网络和 RPN 处理后得到 Ro。对于每个 Ro = (xs, ys, xe, ye),输入该层后可得到 Ro、Rb 和 Ri,其计算公式如下:
- (Rb = (max(0, xs - wb(xe - xs)), max(0, ys - w