
行人重识别
文章平均质量分 61
作为日常笔记,记录自己在行人重识别方向遇到的问题,以及解决方案,新手一枚,欢迎交流
魏大明白
一个在程序猿道路一去不复返的小菜鸡~
展开
-
Video_based_ReID_02
基于视频的行人重识别-021.前言这一节主要解释下数据的导入,模型的训练需要数据的支持,那么我们就需要对数据进行预处理以及数据的输入。对于数据量比较少的时候,我们可以采用手动输入的形式,但当数据量较大时,这种方式就效率太低了。我们需要使用 shuffle, 分割成mini-batch 等操作的时候,我们可以使用PyTorch的API快速地完成这些操作(Dataloader)。DataLoader 是 torch 提供用来包装数据的工具,我们需要将自己的 (numpy array 或其他) 数据形原创 2021-03-28 09:31:57 · 597 阅读 · 0 评论 -
Video_based_ReID_01
基于视频的行人重识别-011.认识mars数据集研究视频行人重识别基本上都绕不过mars数据集,作为视频行人重识别比较认可的数据集,各个顶刊的优秀论文都是在提高mars数据集的rank。那么首先,让我们来认识一下这个数据集:数据集地址info文件我们把上面链接中的内容下载下来,然后解压后按照下列这种方式保存:那么接下来,解释一下这些文件夹中的内容:1.1 bbox_trainbbox_train文件夹中,有625个子文件夹(代表着625个行人id),共包含了8298个小段轨迹(trackl原创 2021-03-27 14:38:09 · 1789 阅读 · 2 评论 -
Video_based_ReID_RNN
前言接下来,我们就来看看视频行人重识别训练模型的其中一种temporal aggregation method:RNN。这是在序列模型训练中常用的一种模型,RNN可以提取到连续图像蕴含的信息,这里使用的是最简单的RNN结构。目前这种方式的试验结果不如其他几种,如B部分:模型输入输入和之前的相同 差别只在经过的网络:imgsimgs.size() = [b,s,c,h,w]在训练级中 b为batch通常设置为32,seq_len设置为4,c为通道数为3,h图片高,w图片宽模型初始原创 2021-03-13 15:19:53 · 351 阅读 · 0 评论 -
Video_based_ReID_TA
前言接下来,我们就来看看视频行人重识别训练模型的其中一种temporal aggregation method:temporal attention。在这个模型中对sequence of image feature使用attention weighted average,给每一个切片c一个attention系数。论文中叙述这是效果最好的一种方式,如C部分:模型输入imgsimgs.size() = [b,s,c,h,w]在训练级中 b为batch通常设置为32,seq_len设置为4,c原创 2021-03-13 14:38:58 · 300 阅读 · 0 评论 -
Video-based-ReID_TP
前言接下来,我们就来看看视频行人重识别训练模型的其中一种temporal aggregation method:temporal pooling。这是比较简单的一种方式,效果也不错,是将通过CNN网络提取到的每一帧T图像特征根据seq_len,使用average pooling融合成每一个clips的特征。模型输入imgsimgs.size() = [b,s,c,h,w]在训练级中 b为batch通常设置为32,seq_len设置为4,c为通道数为3,h图片高,w图片宽模型初始化参数原创 2021-03-13 09:53:23 · 488 阅读 · 0 评论 -
从零开始AlignedReID_04
模型评价指标前言在介绍行人重识别的时候就提到过,常用的评价指标有mAP、cmc、rerank等,那么这篇博客,主要是对这一部分的复现。原创 2021-01-18 18:45:26 · 701 阅读 · 0 评论 -
从零开始AlignedReID_05
损失计算前言深度学习需要根据损失来调整网络参数,本篇主要对于AlignedReID中的losses以及计算losses所需要的distance进行整理。原创 2021-01-18 11:22:51 · 763 阅读 · 0 评论 -
从零开始AlignedReID_03
loss模块实现前言前面两篇博客我们已经把数据的导入以及网络的主体实现了,那么这篇博客主要是为了实现网络的损失。还是上面这张图,我们可以看到,网络主要使用了两个损失函数,即softmax loss以及triplet loss。那么这篇博客主要包括以下几个部分:softmax cross entropy losslocal distanceTriplet lossdeepsupervision1.global feature的softmax loss这里的softmax loss其实是指原创 2021-01-13 14:30:23 · 718 阅读 · 0 评论 -
从零开始AlignedReID_02
模型设计前言在前面已经提到了主要使用的CNN网络是ResNet50网络,那么我们需要在系统提供的库的基础上进行一定的修改,来实现整体的网络结构。1.主体结构实现原创 2021-01-04 15:45:57 · 887 阅读 · 1 评论 -
从零开始AlignedReID_01
数据准备前言从这边博客开始, 就要记录一下复现AlignReID算法的代码,以及在复现过程中遇到的一些问题,作为后续自己实现模型的基础,阅读和理解别人的代码是非常有必要的。并且,在实现代码的过程,会尽量使得代码工程化。那么接下来,就开始吧!认识Market1501数据集在对行人重识别领域有过一定了解的情况下,应该都知道这个数据集了,这次我们就以该数据集进行训练和测试。...原创 2020-12-29 16:26:37 · 1404 阅读 · 0 评论 -
循环神经网络
RNN(循环神经网络)神经网络在介绍循环神经网络之前,先介绍一下常见的神经网络的结构,训练神经网络,无非是通过给定的输入x,通过一层一层的黑盒子,在不断修改黑盒子的参数过程后,得到特定的输出结果y。这一层层的黑盒子对应一个又一个的函数,共同构成我们的神经网络模型。经典的神经网络结构如下图:那么为什么需要RNN呢?为什么需要RNN在你阅读这篇文章时候,你都是基于自己已经拥有的对先前所见词的理解来推断当前词的真实含义。我们不会将所有的东西都全部丢弃,然后用空白的大脑进行思考,也就是说我们在学习新的东转载 2020-12-05 19:40:22 · 1566 阅读 · 0 评论 -
行人重识别-视频重识别
行人重识别–Video ReID前言目前主流的行人重识别方法大部分是基于单帧 图像的, 然而单帧图像给予的信息终究是有限的. 此外, 单帧的方法要求图像质量很高, 这对于相机 的布置和使用的场景是一个非常大的限制, 因此研究基于序列的方法便显得十分重要。介绍. 基于单帧图像 的 ReID 方法可以通过一个简单方法扩展到视频序 列, 即用所有序列图像特征向量的平均池化或者最 大池化作为该序列的最终特征. 但是仍然有很多工作在研究如何更好地利用视频序列来进行行人重识别。这类方法除了考虑了图像的内容信原创 2020-11-15 20:51:54 · 3976 阅读 · 0 评论 -
行人重识别-姿态检测
行人重识别-姿态检测前言从抽取图像特征进行分类, 行人重识别的方法可以分为基于全局特征 (Global feature) 和基于局部特征 (Local feature) 的方法. 全局特征比较简单,是指让网络对整幅图像提取一个特征, 这个特征不考虑一些局部信息. 正常的卷积网络提取的都是全局特征。然而, 随着行人数据集越来越复杂, 仅仅使用全局特征并不能达到性能要求, 因此提取更加复杂的局部特征成为一个研究热点.局部特征是指让手动或者自动地让网络去关注关键的局部区域, 然后提取这些区域的局部特征.原创 2020-11-15 15:42:37 · 5438 阅读 · 0 评论 -
行人重识别-度量学习
行人重识别-度量学习前言和前面介绍到的表征学习一样,度量学习也是基于全局特征学习的一种方法,且被广泛用于图像检索领域。不同于表征学习通过分类或者验证的方式,度量学习目的在于通过网络学习两张图片的相似度。在行人重识别问题上,表现为同一行人的不同图片之间的相似度远大于不同行人的不同图片。定义定义如下一个映射:将图片从原始域映射到特征域(就是从真实图片提取特征的意思),之后再定义一个距离度量函数:来计算两个特征之间的的距离。注:这个距离度量函数并不唯一,只要是能够在特征空间描述特征向量的相似度的函数原创 2020-11-12 21:29:22 · 3030 阅读 · 0 评论 -
行人重识别-表征学习
行人重识别(ReID)-表征学习前言在记录今天的内容前,先推一下罗浩老师的行人重识别的论文综述,这对于了解行人重识别领域是有很大帮助的,接下来的几篇博客呢,也是围绕这篇综述中的内容进行介绍的。行人重识别-罗浩知乎专栏顺便附上几个行人重识别的开源代码:https://github.com/zhunzhong07/IDE-baseline-Market-1501https://github.com/KaiyangZhou/deep-person-reidhttps://github.com/hua原创 2020-11-08 22:07:12 · 3091 阅读 · 0 评论 -
行人重识别基本介绍
行人重识别(ReID)基本介绍前言最近一段时间开始了深度学习领域的学习,但总是东看看西看看停留在表面。看过的东西很快就忘了,遇到不懂的地方也都就扔到了一边,鉴于学术和毕业上的压力,决定开始更新这个博客,一方面记录整理自己学过的东西,另一方面也为了督促自己每天都能够有所进步。这篇文章是在学习罗浩老师发布在bilibili上的课程后进行的,对于那些准备进入行人重识别领域的小白来说,在这里推荐一下罗浩老师的课程。虽说发布时间已经是几年前了,有些框架或者知识已经更新,但仍是不可多得的入门材料。b站浙江大学罗原创 2020-11-07 19:51:31 · 13062 阅读 · 0 评论