Cross-modality Person re-identification with Shared-Specific Feature Transfer

题目:Cross-modality Person re-identification with Shared-Specific Feature Transfer
作者:Yan Lu

一、研究动机
现有的方法大多是将不同模态的特征映射到同一个特征空间,但是这种方法会降低特征的鉴别性。

二、研究目标
提出“跨模态共享-特有特征转换算法”(cm-SSFT),来探究模态共享信息和模态特定特征的识别潜力。
(1)根据共享特征来建模不同模态样本之间的相似性。
(2)在模态内和模态间传输共享特征以及特定特征。
(3)提出互补特征学习策略(包含模态适应,映射对抗学习和重建增强),以学习每个模态的鉴别性、互补性的共享特征和特定特征。

三、技术路线
在这里插入图片描述
以往的方法会丢弃大量重要的特定特征,因为这些特征不能从其他模态中提取。因此,本文试图引入基于近邻相似性建模的特定模态特征,来有效利用每个样本的共享和特定信息。
在这里插入图片描述

  1. Two-stream feature extractor
    提取特征
    在这里插入图片描述
    分类损失约束

### 关于红外-可见光跨模态行人重识别中的X模态实现 #### X模态生成器的设计原理 针对红外-可见光跨模态行人重识别(Infrared-Visible Cross-Modal Person Re-ID, IV-ReID),一种创新的方法引入了辅助的中间模态X来缓解因不同成像条件造成的显著域间差距。具体来说,X模态是由一个基于自监督学习设计的轻量化神经网络产生的,旨在捕捉并转换来自可见光(V)模态的关键视觉特征到一个新的表达形式中[^1]。 #### 实现细节 这个过程涉及到了一系列精心设计的操作: - **双层1x1卷积结构**:首先利用一对连续的1x1大小的卷积核处理原始的三通道彩色图片数据;前者负责降维至单一灰度级别,后者则再次扩展回三维空间以便后续操作。 - **非线性变换**:紧接着上述步骤之后加入了一个ReLU函数作为激活单元,赋予模型更强的数据拟合能力和更丰富的内部表征层次[^5]。 ```python import torch.nn as nn class XModerator(nn.Module): def __init__(self): super(XModerator, self).__init__() self.conv1 = nn.Conv2d(3, 1, kernel_size=1) self.relu = nn.ReLU() self.conv2 = nn.Conv2d(1, 3, kernel_size=1) def forward(self, x): out = self.conv1(x) out = self.relu(out) out = self.conv2(out) return out ``` #### 特征提取与融合策略 为了有效地关联起原本相异甚远的两种传感模式下的观测对象,提出了共享权重机制下的多分支架构来进行联合训练。即让同一套参数同时作用于RGB、X及IR三种类型的样本之上,在统一的空间内完成身份判别任务的同时也促进了彼此之间潜在联系的学习[^4]。 #### 损失函数构建 考虑到实际应用场景中存在的类别不平衡现象以及目标检测难度不均等问题,采用了改进版Triplet Loss——Cross Modal Grouping (CMG) loss Lc ,它不仅能够拉近同类个体间的距离分布,还能有效拉开异类实例之间的间隔,进而提升整体辨识精度。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二苏旧局吖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值