- 博客(119)
- 资源 (8)
- 收藏
- 关注
原创 2019PR之RGBT行人检测:Illumination-aware faster R-CNN for robust multispectral pedestrian detection
Illumination-aware faster R-CNN for robust multispectral pedestrian detection简述:本文发现从RGB或T图像行人检测结果与照明条件相关。考虑到这一点,提出了IAF R-CNN网络。具体地说,首先引入了光照感知网络来给出输入图像的光照度量。然后,我们通过一个定义在光照值上的门函数自适应地合并RGB和T的子网络。左图为光照条件较好的情况下经过门函数后的带权结果,右图为光照条件不好的情况下经过门函数后的带权结果。模型:1,本文
2020-11-06 10:23:39
1531
4
原创 2020 ICRA之RGBT语义分割:PST900: RGB-Thermal Calibration, Dataset and Segmentation Network
PST900: RGB-Thermal Calibration, Dataset and Segmentation Network简述:首先,本文提出了一种RGB-T数据集矫正方法其次,本文是一个比赛提出的,本文通过这种矫正方法对官方提供了PST900进行校正,做到成对数据的完全对齐。最后,提出了一种用于快速语义分割的框架。模型:1数据校正:这个比赛提供的数据集是RGB-D-T数据集,通过Depth信息来校正RGB和T信息对齐,通过T图像得到T到RGB图像的映射关系进行校正,这里不仔细讲了,
2020-10-22 16:42:10
1966
4
原创 2019 RAL之RGBT语义分割:RTFNet: RGB-Thermal Fusion Network for Semantic Segmentation of Urban Scenes
RTFNet: RGB-Thermal Fusion Network for Semantic Segm简述:本文针对RGB-T语义分割任务,利用热图像的优势,并融合RGB和热信息在一个新的深度神经网络。模型:本文只有一个创新点,就是upception模块,其实就是上采样跳链接模块,本文没有太大的创新点,指标达到了sota(Res50的mIOU为51.7):...
2020-10-22 10:54:53
1062
2
原创 2017 IROS之RGBT语义分割:MFNet: Towards Real-Time Semantic Segmentation for Autonomous Vehicles with Multi
MFNet: Towards Real-Time Semantic Segmentation for Autonomous Vehicles with Multi-Spectral Scenes简述:第一篇RGB-T语义分割文章:近年来有关语义分割的研究主要基于在夜间能见度较差和恶劣天气条件下获取的RGB图像。此外,本文尽可能减少了时间消耗,提高速度。模型:17年还没有Res,本文就是最简单的编码解码器,最大通道数是128,所以设计的轻量级网络,网络本身没有复杂的结构。本文提出了RGBT数据集
2020-10-22 10:51:33
1015
4
原创 2020 CVPR 之ReID:AD-Cluster: Augmented Discriminative Clustering for Domain Adaptive Person Re-identi
AD-Cluster: Augmented Discriminative Clustering for Domain Adaptive Person Re-identification简述:当目标域的身份未知时,现有的方法试图通过转移图像样式或跨域对齐特征分布来解决,而目标域中丰富的未标记样本不能充分地实现。本文提出了一种新的增强描述本地聚类(AD-Cluster)技术,该技术可以估计和增强目标域内的人聚类,并通过附加聚类增强re-ID模型的识别能力。AD-Cluster交替训练一个图像生成器和一个
2020-10-15 16:21:27
538
原创 2020 CVPR 之ReID:CamCOCAS: A Large-Scale Clothes Changing Person Dataset for Re-identification
AD-Cluster: Augmented Discriminative Clustering for Domain Adaptive Person Re-identification简述:现有的ReID任务都是在基于同一个人都是相同的衣服进行了,本文为了解决这一问题,提出了换衣人集(COCAS),同时,提出了一种双分支网络——生物特征-服装网络(BC-Net),该网络能够有效地将生物特征和服装特征结合起来,在我们的设置下进行re-id识别。模型:COCAS数据集:生物特征-服装网络(BC-N
2020-10-15 10:15:36
775
2
原创 2020 TIFS之ReID:Visible-Infrared Person Re-Identification via Homogeneous Augmented Tri-Modal Learnin
Visible-Infrared Person Re-Identification via Homogeneous Augmented Tri-Modal Learning简述:现有的方法通常只学习了跨模态特征,而忽略了图像层次的差异。生成图像的思路目前有些方法采用GAN生成交叉模态图像,但会破坏局部结构并引入噪声。本文通过生成的RGB图像的灰度图作为辅助,以减少RGB与IR图像的large gap。模型:本文框架方面通过3个3通道(RGB,Gray,IR)的分别输入到共享权重的Res50学习共
2020-10-06 22:37:47
1397
7
原创 2020ECCV之ReID:Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person Re-Identificat
Dynamic Dual-Attentive Aggregation Learning for Visible-Infrared Person Re-Identification简述:现有的VI-ReID方法倾向于学习全局表示,全局表示的可辨识性有限,且对有噪信息的鲁棒性较差。针对(a)中全局信息问题和噪音问题:通过以下两个思路去解决:(b)模内加权部分聚合(IWPA),它通过挖掘每个模内的上下文部分信息来学习有区别的部分聚合特征。©交叉模态注意力结构(CGSA),通过融合邻域信息增强了交叉模态图结构注
2020-10-06 15:52:13
1369
原创 2020 Arxiv之跨模态Reid:RGB-IR Cross-modality Person ReID based on Teacher-Student GAN Model
RGB-IR Cross-modality Person ReID based on Teacher-Student GAN Model简述:Reid的关键挑战是不同模式下特征的跨模态差异。为了解决这一挑战,我们提出了一种基于不同域的师生模型(TS-GAN)。模型:1.首先,GAN部分,仅采用了RGB生成IR的分支,但IR生成RGB用于辅助训练后期没有用到:(使用L1范数,因为它能比L2范数在图像边缘获得更好的生成性能)2.Backbone(红色部分)将Res50分为前3层(图中FEs)
2020-09-20 16:58:24
1331
原创 2020 TIP之跨模态ReID:Cross-Spectrum Dual-Subspace Pairing for RGB-infrared Cross-Modality Person Re-id
Cross-Spectrum Dual-Subspace Pairing for RGB-infrared Cross-Modality Person Re-Identification简述:本文的主要目的是为了减少不同光谱的摄像机产生的模态差异问题。本文提出了一种新的多光谱图像生成方法,利用生成的样本帮助网络找到鉴别信息,从而实现对同一个人的跨模态重新识别。下图可以看到,SYSU的红外图和RegDB的红外图是明显不同的。解决上述问题的目的是为了解决跨模态ReID的另一个挑战是人内(同一人图像)的差
2020-09-10 12:07:45
662
原创 2020 Arxiv之跨模态ReID:Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person Re-Identi
Bi-directional Exponential Angular Triplet Loss for RGB-Infrared Person Re-Identification简述:现有的研究大多使用基于欧几里得度量的约束来解决不同模式特征之间的差异。由于欧氏距离不能有效地测量嵌入向量之间的夹角,使得这些方法无法学习角度判别特征嵌入。本文提出通过确定了嵌入向量之间的夹角来进行有效的分类问题。同时,本文提出了提出了一种新的提出了一种新的ranking loss,即Bi-directional Expon
2020-09-09 13:45:28
811
原创 2020 ArXiv之跨模态ReID:Parameters Sharing Exploration and Hetero-Center based Triplet Loss for Visible-T
Parameters Sharing Exploration and Hetero-Center based Triplet Loss for Visible-Thermal Person Re-Identification简述:采用双流网络来解决多模态识别中最具挑战性的跨模态差异问题。在本文中,我们探讨了两流网络应该共享多少个参数,这在现有文献中仍未得到很好的研究。同时,提出了提出了hetero-center based triplet loss,通过将anchor与其他所有样本的比较改为anchor
2020-09-08 14:00:49
1299
原创 2020 CVPR之GAN:MSG-GAN: Multi-Scale Gradients for Generative Adversarial Networks
MSG-GAN: Multi-Scale Gradients for Generative Adversarial Networks论文:https://arxiv.org/pdf/1903.06048.pdf1.当前存在的问题GAN在图像合成任务中,目前的问题在于他们不能很好的适应不同数据集,部分原因是由于训练过程的不稳定性和对超参数分析仪的敏感性(模型崩塌),不稳定的原因是,真分布与伪分布没有足够的重叠部分时,从鉴别器到生成器的梯度变得无信息。本文提出了多尺度梯度广义对抗网络(MSG-GAN),
2020-07-16 11:26:31
1603
原创 2020Arxiv之ReID:Deep Learning for Person Re-identification: A Survey and Outlook
Deep Learning for Person Re-identification: A Survey and Outlook本文是夜盲团队在今年发表的综述类文章:论文地址:https://arxiv.org/abs/2001.04193v1AGW开源地址:https://github.com/mangye16/ReID-Survey当前的问题及概述:作者调查了245篇近两三年的行人重识别(Person Re-identification)论文,分类为封闭世界ReID与开放世界ReID,综述
2020-07-10 21:27:35
3049
原创 2019 IJCNN之GAN(image transfer(face)):Attention-Guided Generative Adversarial Networks for Unsupervis
Attention-Guided Generative Adversarial Networks for Unsupervised Image-to-Image Translation当前的问题及概述:通过GAN网络针对image-to-image translation任务目前只能转换low-level特征,而不能转换high-level特征,主要原因是生成器无法检测出图像中最能体现语义的部分,从而导致生成的图像质量较差。针对这一局限性,本文提出了一种基于注意力引导的生成对抗网络(AGGAN),该网
2020-06-27 17:01:37
1474
1
原创 2020 IVC之GAN(image transfer):GANILLA: Generative Adversarial Networks for Image to Illustration Tran
GANILLA: Generative Adversarial Networks for Image to Illustration Translation期刊:Image and Vision Computing(Elsevier,3区)开源:https://github.com/giddyyupp/ganilla当前的问题及概述:1.尽管目前最先进的图像-图像转换模型可以成功地转换风格或内容,但它们不能同时转换两者。本文提出了一个新的生成器网络来解决这个问题,并表明产生的网络在风格和内容之间实现
2020-06-16 17:22:32
1404
2
原创 2017 NIPS之GAN(image transfer):Unsupervised Image-to-Image Translation Networks
Unsupervised Image-to-Image Translation Networks开源:https://github.com/mingyuliutw/unit.当前的问题及概述:无监督图像-图像转换的目的是利用图像在单个区域的边缘分布来学习图像在不同区域的联合分布。由于存在无穷多的联合分布集合,可以得到给定的边际分布,如果没有额外的假设,就不能从边际分布中推断出联合分布。本文提出了一个共享潜在空间的假设,并提出了一种基于coupled GANs的无监督图像-图像转换框架。模型及los
2020-06-11 17:22:17
903
原创 2018 LNCS之GAN(image transfer):Multimodal Unsupervised Image-to-Image Translation
Multimodal Unsupervised Image-to-Image Translation开源:https://github.com/nvlabs/MUNIT当前的问题及概述:无监督图像到图像的转换目前CV中一个重要的问题,在没有pair的前提下,学习源域对应图像在目标域内的条件分布。现有的方法为确定性的一对一映射,因此,它们无法从给定的源域图像生成不同的输出。为了解决这一限制,本文提出了一个多模态无监督图像到图像转换(MUNIT)框架。图中(a)每个域Xi中的图像被编码到一个共享的内
2020-06-09 18:50:29
452
原创 2017 ECCV之ReID:Beyond Part Models Person Retrieval with Refined Part Pooling (PCB)
Beyond Part Models Person Retrieval with Refined Part Pooling(and A Strong Convolutional Baseline)当前的问题及概述:本文使用part特征对行人图像描述提供了细粒度的信息,对所有图像的人物进行分part提取,本文有两点贡献:1,一个名为基于部分卷积基线(PCB)的网络。2,(ii)改进的部分池化(RPP)方法。下图为不同文献的分part方法,本文提出的PCB为f,采用均匀分part的方法,将图像分成均匀的不同
2020-06-09 14:45:48
505
原创 2019 CVPR之ReID:Re-ranking via Metric Fusion for Object Retrieval and Person Re-identification
Re-ranking via Metric Fusion for Object Retrieval and Person Re-identification当前的问题及概述:视觉因素的变化,如视点、姿势、白光和背景,通常被认为是re-ID任务的重要挑战。尽管这些因素是有影响的,但关于它们如何影响认知系统的定量研究仍然缺乏。本文通过探究viewpoint对系统的影响进行探究,有两大突出贡献,首先,引入了一个大型合成数据引擎PersonX。由手工制作的3D人物模型组成,该引擎的突出特点是“可控”。也就是说
2020-06-04 20:20:55
1212
1
原创 ReID行人重识别中的Query sets 和Gallery sets以及单模态ReID和跨模态ReID数据集
无论是单模态还是跨模态ReID同样都作为匹配任务在测试时会用到两个数据集,Query sets 和Gallery sets,主要有以下特征:ReID数据集:1.数据集分为训练集、验证集、Query sets、Gallery sets2.数据集通常是通过人工标注或者检测算法得到的行人图片,目前与检测独立,注重识别3.在训练集上进行模型的训练,得到模型后对Query与Gallery中的图片提取特征计算相似度,对于每个Query在Gallery中找出前N个与其相似的图片4.训练、测试中人物身份不重复
2020-06-04 16:01:17
8293
原创 2019CVPR之ReID:Interaction-and-Aggregation Network for Person Re-identification
Interaction-and-Aggregation Network for Person Re-identification当前的问题及概述:由于CNNs具有固定的几何结构,其在人的姿态和尺度的巨大变化建模中具有固有的局限性:a展示了同一ID的不同姿态,b展示了小样本或不完全等问题。由于目前CNN提取特征有以下两种方法,一是定位身体部分,并将其组合起来,但即使是最先进的部分检测解决方案也不是完美的。另一种方法是多尺度特征融合,即在网络的多层上计算特征图。本文提出了一种通过交互-聚合(IA)的方
2020-06-02 11:51:46
639
3
原创 2019 CVPR之ReID:Towards Rich Feature Discovery with Class Activation Maps Augmentation for Person Re-
Towards Rich Feature Discovery with Class Activation Maps Augmentation for Person Re-Identification当前的问题及概述:在Re-ID任务中,人物间较小的差异需要模型来捕获足够细粒度的特性。基于此,1,本文通过CAM扩展了baseline重建模型的激活范围,以探索丰富的视觉线索。2,提出了一种Overlapped Activation Penalty方法,使当前分支对先前分支激活较少的图像区域给予更多的关注,
2020-05-20 15:36:27
627
原创 2019 CVPR:Patch-based Discriminative Feature Learning for Unsupervised Person Re-identification
Patch-based Discriminative Feature Learning for Unsupervised Person Re-identification当前的问题及概述:虽然针对差异性局部特征对ReID任务是有效的,但它们仅限于成对的被标记数据大间隙上进行训练,但在其他小间隙的不相似部分获取起来成本较大。如下图:本文提出了一个基于patch的无监督学习框架来克服这个问题,以便从patch而不是整个图像中学习识别特征,大大减少了计算复杂度和成本。模型及loss:本文提出的Pat
2020-05-14 13:28:23
1141
原创 2018 CVPR:Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training
Pyramidal Person Re-IDentification via Multi-Loss Dynamic Training当前的问题及概述:大多数现有的方法高度依赖bounding box,然而,由于实际场景的限制,目前的检测模型往往产生不准确的bounding box,进而避免了算法的性能。本文提出了一种新的由粗到细的金字塔模型,该模型不仅融合了局部信息和全局信息,而且还强化了局部信息和全局信息之间的线索,避免了bounding box的不准确性带来的影响。可以从下图看到,由于boundi
2020-05-12 17:06:13
855
原创 2019 CVPR(oral)之ReID:Joint Discriminative and Generative Learning for Person Re-identification
Joint Discriminative and Generative Learning for Person Re-identification当前的问题及概述:目前,ReID任务通过GAN网络训练越来越热门,然而,现有方法中的G途径与D再识别学习阶段相对独立。因此,reid模型通常直接对生成的数据进行训练。本文提出了一个联合学习框架,将ReID任务和端到端的图像生成结合起来。提出的模型包括一个生成模块,它将每个人分别编码为一个外观码和一个结构码,以及一个判别模块,它与生成模块共享外观编码器。生成模
2020-05-09 12:43:09
1096
原创 2019 CVPR之ReID:Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-Identification
Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-Identification当前的问题及概述:本文研究的是从标记的源域和未标记的目标域学习一个新的领域自适应ReID模型。以往的方法主要是减少源域和目标域之间的特征分布距离。然而,这样忽略了目标域内部的变量从而影响实验结果。而本文通过样本不变性、相机不变性和近...
2020-05-06 20:39:48
540
原创 2019 CVPR之ReID:Densely Semantically Aligned Person Re-Identification
Densely Semantically Aligned Person Re-Identification当前的问题及概述:目前ReID如图1中存在的问题:(a)不同的摄像机视点,(b)不同的姿态,©不完善的人检测,(d)局部内的错位,(e)杂乱的背景,(f)遮挡而造成的人的空间错位。本文通过对人即时信息语义的估计,构造了一组语义密集对齐的局部图像(dsap image),其中相同的空间位...
2020-04-30 23:06:35
692
原创 2019CVPR之ReID:Distilled Person Re-identification Towards a More Scalable System
Distilled Person Re-identification Towards a More Scalable System当前的问题及概述:目前RGB-RGB ReID包含3个问题:(1)通过减少标签量来降低标签成本;(2)通过重用现有知识来降低扩展成本;(3)通过使用轻量级模型来降低测试计算成本。这三个问题本文统称为可扩展性问题。因此,本文基于这一问题,提出了一个可扩展自适应Re-...
2020-04-29 12:59:07
473
原创 2020 AAAI之ReID:Infrared-Visible Cross-Modal Person Re-Identification with an X Modality
Infrared-Visible Cross-Modal Person Re-Identification with an X Modality论文:https://download.youkuaiyun.com/download/qq_41967539/12363836当前的问题及概述:1,红外和可见光分别包含了许多不同的信息,以往的方法倾向于直接从这两种原始模态中学习跨模态信息。但结果说明这种直接映...
2020-04-26 13:27:21
1336
原创 2020 CVPR之image matting:Background Matting:The World is Your Green Screen
Background Matting:The World is Your Green Screen当前的问题及概述:现有的方法都需要背景和trimap信息进行estimate matte在本文中,我们需要原图及背景的附加照片,虽然准备阶段复杂,但节省了大量创造trimap的时间以及提升了最终的效果。具体见图1:模型及loss:输入为原图I和背景图B’,通过生成的soft segmen...
2020-04-23 21:41:53
3903
1
原创 2020 TIP之image matting:BACKGROUND MATTING
BACKGROUND MATTING当前的问题及概述:目前的alpha matting方法主要依赖于trimap来指导estimate alpha。而本文研究了除了trimap信息外的背景信息和alpha信息进行estimate alpha。模型及loss:2.1 Generator G本文提出的AlphaGan-BG Network是建立在第一个提出的GAN来估计alpha matt...
2020-04-16 17:03:15
1007
原创 2020 CVPR之image matting:AlphaNet: An Attention Guided Deep Network for Automatic Image Matting
AlphaNet: An Attention Guided Deep Network for Automatic Image Matting当前的问题及概述:本文提出的image matting方法是一种将语义分割和深度图像匹配过程融合成单一网络的方法,以生成用于图像合成任务的详细的语义匹配。1.提出了一种新的模型结构,将上采样和下采样算子的功能与attention相结合,并将分割和匹配(m...
2020-04-14 19:18:19
1623
原创 2019 ICCV之image matting:Disentangled Image Matting
Disentangled Image Matting当前的问题及概述:以前的大多数图像匹配方法都需要一个大致指定的trimap作为输入,并为trimap未知区域中的所有像素估计分数alpha值。直接从粗糙的Trimap估计alpha matte是先前方法的主要局限性,因为这种做法试图同时解决两个困难且本质上不同的问题:识别Trimap区域内的真实混合像素, 和为它们估算准确的alpha值。提...
2020-04-10 16:03:10
1572
1
原创 2017 CVPR之image matting(抠图):Deep Image Matting
Deep Image Matting当前的问题及概述:当图像具有相似的前景和背景颜色或复杂的纹理时,以往的算法性能较差,主要是两个方面:1)只使用low-level feature,2)缺少high-level context。本文较之间的工作最大的改进在于,本文更加细致的学习了alpha mattes中的自然结构,而不是主要依赖颜色信息进行image matting。模型及loss:2...
2020-04-08 12:05:53
1733
原创 2018 CVPR之语义分割:Weakly-Supervised Semantic Segmentation Network with Deep Seeded Region Growing
Weakly-Supervised Semantic Segmentation Network with Deep Seeded Region Growing当前的问题及概述:在语义分割任务中,为了减少人工标注的数据量,现在的很多算法转移到了弱监督任务(有image-level标注,无pixel-level标注)上,目前研究该问题的方法主要是利用深度网络对每个对象类的稀疏区域和描述区域进行推理...
2020-04-02 15:19:14
1915
原创 2018 BMVC之GAN+seg:Adversarial Learning for Semi-Supervised Semantic Segmentation
Adversarial Learning for Semi-Supervised Semantic Segmentation当前的问题及概述:现有的鉴别器大都在图像层次上对输入图像进行真伪分类训练,而我们设计了一种全卷积的鉴别器,在考虑空间分辨率的情况下,从ground-truth中对预测概率图进行区分。此外,全卷积鉴别器通过在未标记图像的预测结果中发现可能区域,实现半监督学习,从而提供额外的...
2020-03-30 23:06:15
2450
4
原创 2017 NIPS之GAN+seg:Generative Semantic Manipulation with Contrasting GAN
Generative Semantic Manipulation with Contrasting GAN当前的问题及概述:如今的GAN网络在图片风格迁移方面有了很大的突破,但是现有的模型只能传递low-level信息(如颜色或纹理变化),而不能编辑high-level语义信息(如几何结构或内容)。另一方面,虽然一些研究可以合成具有类标签或说明的引人注目的真实世界图像,但它们不能限定任意的形状...
2020-03-29 15:01:50
691
原创 2020 CVPR之视频动作识别:Multi-Modal Domain Adaptation for Fine-Grained Action Recognition
Multi-Modal Domain Adaptation for Fine-Grained Action Recognition当前的问题及概述:无监督域适应(UDA)方法经常用于源域和目标域之间的对抗训练。但在一个环境中培训一个模型,然后部署到另一个环境中,由于不可避免的域转换,会导致性能下降。而且这些方法并没有探索视频在每个域中的多模态特性。本文提出了多模态动作识别的UDA方法。改进的...
2020-03-27 19:26:19
4777
原创 2019 ICIP之多光谱行人检测:UNPAIRED CROSS-SPECTRAL PEDESTRIAN DETECTION VIA ADVERSARIAL FEATURE LEARNING
UNPAIRED CROSS-SPECTRAL PEDESTRIAN DETECTION VIA ADVERSARIAL FEATURE LEARNING当前的问题及概述:本文提出的框架采用行人检测网络和区域生成的对抗网络,能够生成互补的跨光谱行人特征。本文多光谱行人检测的说明:模型及loss:本文提出的跨模态行人检测框架。使用两个交叉光谱嵌入网络将每个光谱图像编码到公共空间中。为了对...
2020-03-22 11:06:20
926
3
Single-module person-reid(单模态ReID)论文.rar
2020-05-13
20.AAAI-X-modality.pdf
2020-04-26
cross-module ReID(跨模态人物重识别)论文.rar
2020-03-12
李宏毅2019 GAN网络 PPT 文案.docx
2019-11-18
sinGAN及其文案.rar
2019-11-18
蚁群算法.pptx
2019-10-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人