MixStyle 双渠道特征融合的行人重识别方法
1. 研究背景与主要贡献
在行人重识别领域,损失函数可分为表征损失和度量损失。表征损失的典型方法是基于分类信息计算的交叉熵损失;度量损失则是基于特征间距离不断优化映射函数,常用的有验证损失和三元组损失。三元组损失虽能约束正负样本与锚点的距离差,但无法保证正样本与锚点的距离足够小,聚类效果不明显。
主要贡献如下:
1. 设计基于 MixStyle 的特征泛化模块,扩展原始特征的潜在域,提高网络泛化性能。
2. 对三元组损失进行优化,为正样本距离设置约束,使聚类效果更清晰。
3. 提出基于全局特征的双渠道特征融合行人重识别模型,实验表明该方法优于现有基于全局特征的算法。
2. MixStyle 风格融合研究
图像背景在图像识别中常被视为干扰,但获取图像风格信息有助于识别工作。图像的风格信息决定其所属领域,但输入深度网络后,输出中该信息会消失。MixStyle 方法通过混合两张图像的风格信息形成新风格图像,语义信息不变,可用于训练模型,在分类、实例检索和强化学习中表现出强泛化性能。
在行人重识别中,数据集来自不同环境和相机的图像,风格差异大。为提高模型泛化能力,在 ResNet - 50 网络的第一和第二个残差块后插入 MixStyle 模块,混合不同领域图像风格,为模型提供更多潜在域图像。同时保留初始特征提取模块,融合两部分特征训练模型,实验证明该方法能提取多样风格信息,提高模型泛化能力。
3. 行人重识别方法
3.1 整体网络结构
基于图像特征所在领域信息与图像风格信息的紧密联系,设计特征泛化
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



