- 博客(24)
- 资源 (21)
- 收藏
- 关注
原创 Relation-Aware Pedestrian Attribute Recognition with Graph Convolutional Networks
动机:1.大多数工作只使用简单的多任务学习(MTL)框架来利用多个属性之间的关系,其中不同属性之间的信息交换只允许在共享的低级层中进行。由于MTL利用最后一层的损失来指导学习,因此不同属性之间的显式信息交换和传播可能不够充分。2.虽然深卷积网络在行人属性识别方面取得了很大的成功,但是上下文关系并没有得到充分的利用。这是因为根据研究结果,这些深卷积网络中单位的感受野受到了严重的限制。贡献:(1) 提出了一种新的端到端统一框架,利用GCN来捕获行人属性识别中的属性和上下文关系;(2)提出了两种新的图结
2020-07-12 14:55:59
1208
7
原创 Self-supervised Training of Graph Convolutional Networks
动机:GCNs需要邻接矩阵作为输入来定义这些非网格数据之间的关系,这就导致所有的数据,包括训练数据、验证数据和测试数据,通常只形成一个用于训练的图结构数据。此外,邻接矩阵通常是预定义的且平稳的,这使得数据增强策略不能在构造的图结构数据上使用来增加训练数据的数量。为了进一步提高有限训练数据下的学习能力和模型性能贡献:提出从输入图结构数据本身中挖掘可用信息,以提高基于图的模型的学习识别能力和性能。与图像或视频等常规网格数据不同,图结构使用边来存储结构信息以及节点之间的关系。除了结构信息之外,图中的每个节点
2020-06-30 16:51:54
804
原创 Attention-Based Pedestrian Attribute Analysis
动机:由于姿态变化较大,背景复杂且摄像机视角不同的行人图像带来的挑战。为了针对变化选择重要且有区别的区域或像素,通过从不同的角度考虑问题来获取有效信息。贡献:1.以一种多任务的方式同时学习不同的注意力机制,以探索相关的互补信息。2.提出了三种用于行人属性分析的注意机制:解析注意,标签注意和空间注意。解析注意是在像素级位置提示的指导下制定的,而标签注意和空间注意旨在分别为每个属性和所有属性选择重要区域和区分区域。从不同角度考虑问题的三种注意力机制是相互关联和互补的。3.对新的行人解析数据集进行了注释,
2020-06-30 16:41:04
487
原创 Research on Pedestrian Attribute Recognition Based on Semantic Segmentation in Natural Scene
动机:以往的研究主要使用传统的机器学习方法和神经网络来识别行人属性,主要判断自然场景中行人属性的存在性。但是,仅仅判断属性是否存在是不够的,获取属性的位置通常会提供更多的信息。例如,行人的位置信息有助于提高行人重新识别的能力。我们知道,人类将属性的位置作为辅助信息来判断两个行人是否为同一个人。另一方面,如果获得了属性的位置,我们可以对一些已知位置信息的属性进行进一步的研究,比如分析包包的品牌,鞋子的尺码等等。贡献:(1)提出了第一个自然场景中行人属性语义数据集PASD(行人属性语义数据集)。(2)利
2020-06-30 15:52:08
368
原创 ResNeSt的代码阅读(pytorch版本)ResNeSt Split-Attention Networks
Torch版本主要分为四部分,ResNet、ResNeSt、split-attention和ablationsplit-attention模块也就是下面的图:上图对应论文中的:ResNet就是基本的resnet的编码:class Bottleneck(nn.Module):就是对ResNet的bottleneck的编写,需要说的是,全局平均池化没有采用之前的网络采取对池化函数进行...
2020-04-27 11:26:47
5263
原创 Improved Residual Networks for Image and Video Recognition
通过这篇文章对该论文进行的了解更推崇上面这篇文章,因为写的很详细动机:1.ResNet的主要结构是ResBlock块,。ResNet的特定设计是为了方便信息在网络中进行前向传播和反向传播。每个ResBlock包含三个卷积(2个1×1和1个3×3),然后加3个ReLU层。会对负权值清零而对信息传播带来负面影响,尤其再刚开始训练的时候,因为会存在很多的负权值。2.原始ResNet架构中,由于x...
2020-04-27 11:20:29
468
原创 ResNeSt: Split-Attention Networks
代码地址:提供PyTorch和MXNet双版本:https://github.com/zhanghang1989/ResNeSt动机:1.由于ResNet模型最初是为图像分类而设计的,它们可能不适合各种下游应用,因为接收场大小有限且缺乏跨通道交互。这意味着提高特定计算机视觉任务的性能需要网络手术来修改ResNet,使其对特定任务更有效。2.最近的工作通过大规模神经档案结构搜索(NAS)显著...
2020-04-20 09:30:39
5541
原创 An Attention-Based Deep Learning Model for Multiple Pedestrian Attributes Recognition
动机:1.考虑到不同的全身属性之间的语义相关性强。2.每一类占得权重大小影响属性的识别程度,比如说背景和前景的比重贡献:1.提出了一种PAR的多任务分类模型,其主要特征是聚焦于前景(人体)特征,减弱特征表示中背景区域的影响;2.提出了一个加权和损失函数,有效处理优化机制中每个类别(如性别、身材、年龄等)的贡献,在推理步骤中禁止某些类别占主导地位;3.受到注意机制的启发,实现了一个元素级...
2020-04-13 20:25:54
1003
原创 Multi-Task Learning via Co-Attentive Sharing for Pedestrian Attribute Recognition
动机:为了在两个单独的任务网络之间共享特征表示,传统的方法,如Cross-Stitch和Sluice网络学习特征或特征子空间的线性组合。然而,线性组合排除了通道之间复杂的相互依赖关系。此外,空间信息交换的考虑较少。贡献:提出了一种新的共注意共享(co - Sharing, CAS)模块,该模块提取识别通道和空间区域,从而在行人属性识别中实现两个任务网络之间更有效的特征共享。它包括三个分支:协...
2020-04-13 20:20:46
580
原创 A multi-branch separable convolution neural network for pedestrian attribute recognition
动机:DSC层由于其高效的学习能力和简化的参数集,已经在各种应用中得到应用。研究人员多年来利用卷积神经网络(convolutional neural networks, CNN)提出了各种解决方案,但是我们将DSC层引入到CNN中来解决行人属性识别的问题。多年来,RGB一直是计算机视觉研究人员选择的颜色空间。其他著名的颜色空间包括YCrCb, HSV和Lab。在分离色度和亮度分量时,每个颜色空...
2020-04-13 19:51:43
412
原创 总结的人工智能领域论文搜索链接,大部分可用。
网址1 https://booksc.xyz/s/?网址2 https://sci-hub.org.cn/ (我试的只能在google浏览器打开)网址3 http://gen.lib.rus.ec/ (只能在google浏览器打开)网址4 https://zh.booksc.org/ 1和4是差不多的网址5 http://pubmed.cn/ 这个网址偏医学网址6 http...
2020-04-13 19:27:16
1172
原创 GhostNet: More Features from Cheap Operations
动机:1.传统的CNN通常需要大量的参数和浮点运算(FLOPs)才能达到满意的精度;2.尽管最近的工作,例如MobileNet和ShuffleNet引入了深度可分离卷积或混淆卷积操作,以使用较小的卷积核(浮点运算)来构建有效的CNN,但1x1卷积层仍将占用大量内存和FLOPs;3.MobileNet和ShuffleNet这类模型在较少FLOPs下获得了高性能,但特征映射之间的相关性和冗余性却...
2020-04-06 12:09:17
611
原创 Mixed High-Order Attention Network for Person Re-Identification
动机:作者认为目前attention的操作都太过于粗糙,工作主要集中在粗糙的或一阶的注意力设计上,例如 spatial attention 和 channel attention ,需要高阶的操作以获取更多local之间的关系。贡献:1.提出了高阶注意分配(HOA)模块来捕获和利用高阶注意分配。2.将ReID重新考虑为零样本学习任务,并提出了混合高阶注意力网络(MHN),以有效利用多个HO...
2020-04-06 10:43:10
1195
原创 Person Search by Separated Modeling and A Mask-Guided Two-Stream CNN Model通过分离建模和掩码指导的两流CNN模型进行人员搜索
结论:对于人员搜索问题,通过分别而不是联合解决行人检测和人员重新识别任务,可以实现更好的性能。Motivation:1.Instead of sharingrepresentations in a single joint model, we find that separating detector and re-ID feature extraction yields better per...
2020-03-22 14:53:25
451
原创 Cross-Batch Memory for Embedding Learning
动机:基于对的方法的性能在很大程度上依赖于其挖掘信息负对的能力。为了从每个minibatch中收集到足够的信息负对,对采样方案进行了大量的改进工作。但是无论采样方案有多复杂,硬挖掘能力在本质上都受到小批量大小的限制,这决定了可能的训练对数量。因此,为了改进取样方案,可以直接扩大小批量尺寸,从而可以立即提高基于对的DML方法的性能。贡献:1.我们发现了一个有趣的“缓慢漂移”现象,即在整个训练过...
2020-03-22 14:51:53
2332
原创 Pedestrian Attribute Recognition via Hierarchical Multi-task Learning and Relationship Attention
动机:在属性定位中增加像素级的监督,从而改进特征学习;局部属性和全局属性存在空间差异;不同属性之间存在语义关系。贡献:(1)提出了一种端到端的深度多任务学习方法,将语义分割与特征学习中的细粒度像素级属性定位相结合。(2)提出了一种两阶段学习策略,通过在单个模型中逐级分离粗属性定位和细属性识别来增强特征学习。(3)提出了一个属性关系注意模块来捕捉不同属性之间的关系,进一步增强了该特征以更...
2020-03-16 10:06:51
383
原创 Incremental Few-Shot Learning for Pedestrian Attribute Recognition
动机:大多数现有的方法都是为一组固定的属性设计的。他们无法处理增量式的少样本学习场景,即将一个训练有素的模型应用于新添加的具有稀缺数据的属性,而这些数据通常存在于现实世界中。Contribution:1.They raise a practical issue termed as incremental few-shot (multi-label) attribute learning wh...
2020-03-15 23:12:30
750
原创 Attribute Aware Pooling for Pedestrian Attribute Recognition
动机:现有的普通CNNs由于标签空间较大,且存在属性纠缠和关联,不能直接应用于多属性数据的处理。我们通过充分利用不同属性之间的相关性来解决这些阻碍CNNs多属性分类发展的挑战。采用多分支结构对不同区域的属性进行功能调用。除了基于各分支本身的预测外,还利用各分支的上下文信息进行决策。开发了属性感知池来集成这两种信息。因此,利用上下文信息可以准确地识别出与他人模糊或纠结在一起的属性。贡献:提出了...
2020-03-15 17:39:37
569
原创 Visual-semantic graph reasoning for pedestrian attribute recognition(VSGR)
contributions :(1) A visual-semantic graph reasoning framework is proposed to jointly model spatial and semantic relations for sequential pedestrian attribute prediction.(2) A novel end-to-end archi...
2020-03-15 16:02:18
1023
原创 Recurrent attention model for pedestrian attribute recognition
动机:许多需要识别的语义行人属性往往表现出空间局部性和语义相关性,并可以据此进行分组,而以往的研究大多忽略了这一现象。而且递归神经网络(RNN)学习上下文关联具有超强能力、注意模型(Attention Model s)在特征图上突出感兴趣区域具有一定的能力。contributions:1.We put forward novel recurrent approaches termed as ...
2020-03-15 14:47:38
493
原创 Deep imbalanced attribute classification using visual attention aggregation 2018
动机:现有的方法要么采用计算机视觉方法,但没有考虑到类的不平衡,要么探索机器学习解决方案,而忽略了图像中存在的空间和语义关系。contributions:1.the design and analysis of an end-to-end neural-network architecture that can be easily reproduced, is easy to trainand...
2020-03-15 11:21:24
725
原创 PGDM (ICME-2018)
动机:Existingmethods usually solve it with end-to-end multi-label deep neural networks, while the structure knowledge of pedestrian body has been little utilized. Considering that attributes have stron...
2020-03-14 18:54:13
1038
原创 Interactive Natural Language-Based Person Search基于交互式自然语言的人员搜索
该方法Pythia-reID具有一定的人机交互功能,在实际情况下性能比较优越。动机:基于语言的re-ID可以看作是视觉问题回答(VQA)任务。在基于语言的检索过程中,如果描述不够有区别,用户提供的信息可能不足以识别POI。因此,本文研究了一种引导策略,即机器人主动地按顺序要求用户提供特定的外观特征,而不是被动地给予用户描述目标人物的自由。为此,我们定义了一组足以覆盖人的外观的引导问题,并通过它...
2020-03-08 22:24:31
468
原创 Adversarial Attribute-Text Embedding for Person Search with Natural Language Query
用于自然语言查询的人物搜索的对抗属性文本嵌入提出了基于文本查询的人搜索的对抗属性-文本嵌入(AATE)网络。既有作品在跨模态相似或共同特征空间中保持语义上的密切联系,又进一步追求视觉和文本表征的模态不变性。也就是说,在视觉和文本模式上的分布被鼓励在学习表征中是相似的。现有的方法多基于行人的视觉外观特征,对背景杂波、光照变化、人体姿态、视点等具有一定的鲁棒性。基于自然语言查询的人搜索是一项新兴...
2020-03-08 22:12:16
382
SSS-PTS 2.0.0
2022-09-28
Pedestrian Attribute Recognition with Graph Convolutional Network in Surveillanc
2020-07-06
Relation-Aware Pedestrian Attribute Recognition with.pdf
2020-07-06
Attention-Based Pedestrian Attribute Analysis.pdf
2020-06-30
Research on Pedestrian Attribute Recognition Based on Semantic Segmentation
2020-06-30
Attention-Based Pedestrian Attribute Analysis.pdf
2020-06-08
Improved Residual Networks for Image and Video Recognition.pdf
2020-04-27
20200417_ResNeSt Split-Attention Networks.pdf
2020-04-20
An Attention-Based Deep Learning Model for Multiple Pedestrian.pdf
2020-04-13
Mixed High-Order Attention Network for Person Re-Identification.pdf
2020-04-05
GhostNet: More Features from Cheap Operations.pdf
2020-04-05
Delving into Unbiased Data Processing for Human Pose Estimation.pdf
2020-04-05
1912.06798.pdf
2020-03-22
MTMS+Att PAR+via Hierarchical Multi-task Learning and Relationship Attention
2020-03-16
Incremental Few-Shot Learning for Pedestrian Attribute Recognition.pdf
2020-03-15
Attribute Aware Pooling for Pedestrian Attribute Recognition.pdf
2020-03-15
Recurrent attention model for pedestrian attribute recognition.pdf
2020-03-14
Deep Imbalanced Attribute Classification using Visual Attention Aggregation
2020-03-14
PGDMPose guided deep model for pedestrian attribute recognition in surveillance
2020-03-14
Adversarial Attribute-Text Embedding for Person Search with Natural Language Que
2020-03-08
Interactive Natural Language-Based Person Search.pdf
2020-03-08
Person Search by Separated Modeling and A Mask-Guided Two-Stream CNN Model.pdf
2020-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人