- 博客(89)
- 资源 (3)
- 收藏
- 关注

原创 【汇总】行为识别、时序行为检测、弱监督行为检测、时空行为定位论文代码(持续更新!!!)
视频行为识别与轻量化网络的前沿论文、代码等https://zhuanlan.zhihu.com/c_1207774575393865728CVPR 2020 行为识别/视频理解论文汇总https://zhuanlan.zhihu.com/p/141429177CVPR 2020 论文大盘点-动作识别篇https://cloud.tencent.com/developer/article/1664055CVPR 2020 论文大盘点-动作检测与动作分割篇https://www.sohu.com/
2020-12-08 14:57:07
4076
1

原创 深度学习:YOLO v3(darknet)——训练自己的VOC数据
论文:YOLOv3: An Incremental Improvement 论文地址:https://pjreddie.com/media/files/papers/YOLOv3.pdfdarknet代码:https://github.com/AlexeyAB/darknet#how-to-compile-on-linux 本文配置的方法也主要是参考 https://github...
2018-10-23 21:37:32
12490
11

原创 行人重识别(Person Re-ID)【一】:常用评测指标
1、gallery和probe:gallery是候选行人库,probe是待查询输入,也叫查询图像(query)。 2、single shot 和muti shot:前者是指gallery中每个人的图像为一张(N=1),而后者是指gallery中每个人的图像为N>1张图像,同样的Rank-1下,一般N越大,得到的识别率越高。 3、rank-n:...
2018-10-10 18:01:45
8797

原创 caffe深度学习【十三】:Caffe的 solver 参数详解
简述:相信跑过caffe框架的同学都知道一般进行训练,我们都需要如下几个文件/文件夹:1)models文件夹 就是存放训练得到的模型,也就是保存网络中的各种W和b的参数2)train-SE.sh 其实就是一个脚本文件,里面写上类似这样的:/home/lincanran/caffe/.build_release/tools/caffe train -solver=/h...
2018-08-30 19:47:55
865

转载 行人重识别(Person Re-ID)【二】:基于深度学习的行人重识别研究综述
本文转载自:https://zhuanlan.zhihu.com/p/31921944 前言:行人重识别(Person Re-identification)也称行人再识别,本文简称为ReID,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。在监控视频中,由于相机分辨率和拍摄角度的缘故,通...
2018-08-29 10:50:55
3375
2

原创 caffe深度学习【九】目标检测 yolo v1的caffe实现 基于VOC2007数据集
YOLO v1算法原文的作者是在darknet框架下实现的, 原文作者的实现 ,这里主要讲的是caffe版本的YOLO实现,主要采用yeahkun写的:点击打开链接 其实只是步骤相对来说有点繁琐,但是要跑通并不困难:大致步骤包括:1、编译caffe-yolo 2、下载VOC2007数据集 3、生成list文件4、生成LMDB文件5、训练6、测试...
2018-08-08 20:23:51
2402
9
原创 ubuntu(linux)系统查看文件夹下有多少文件
1. 查看当前目录所有文件和文件夹的大小方法一:du−sh∗或du -h -d 0 *'-d 0' 代表查询目录的深度为0 ,也就是当前目录,'-d 3' 表示文件目录深度为3,可以查到当前目录下的1~3级目录。方法二:ls−lh或ls -lht2. 查看并统计文件和文件夹数目统计当前目录下文件数目:$ls -l | grep '^-' | wc -l统计当前目录及所有子目录下文件数目:$ls -lR | grep '^-' | wc -l统计当前目录...
2021-05-24 14:17:43
5748
原创 Windows下通过VNC访问Linux服务器(可视化界面)
问题:实习公司用的是服务器,我们只能使用SecureCRT通过指令进行类似linux系统下终端的指令操作,如下图:而上传文件就要通过WinSCP:一般的工作,不需要可视化界面也能完成可是,当我们有些操作需要显示出来,就有问题了,例如我们训练完ssd,想在图片或者视频上测试,看看效果:没办法显示!!所以,我就想实现服务器也能可视化!VN...
2020-06-04 10:00:53
109287
23
原创 python cv2视频抽帧保存
import cv2import osimport shutil#input videofilename = '20190327.mp4'savedpath = filename.split('.')[0] + '/'isExists = os.path.exists(savedpath)if not isExists: os.makedir...
2019-03-27 16:43:13
4032
3
原创 ImportError: No module named 'torchsample' 问题解决方案
在跑pytorch代码时候遇到这个问题:ImportError: No module named 'torchsample' 安装相关依赖即可:如果没有装git的同学,要先装上git:pip3 install gitpip3 install -e git+https://github.com/ncullen93/torchsample.git#egg=torch...
2019-03-08 10:35:48
5682
原创 ffmpeg(ubuntu16.04):视频抽成帧(图片)/图片合成视频
· 视频抽成帧(图片):cd 到视频所在目录下; 输入:ffmpeg -i output-processed.avi -q:v 2 -f image2 frame_%06d.jpg(注:上述代码中, -i 是用来获取输入的文件,-i “*.avi” 就是获取这个叫做星号的avi视频文件;此外还有一些参数:-r 是设置每秒提取图片的帧数,-r 1的意思就是设置为每秒获取一帧...
2019-02-28 17:43:22
2625
原创 如何在linux下解压 .solitairetheme8 文件
我们从Nvidia官网上下载下来的cudnn for linux的文件格式是.solitairetheme8,想要解压的话需要先转成tgz格式再解压: cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 cudnn-8.0-linux-x64-v5.1.tgztar -xvf cudnn-8.0-linux-x64-v5.1.tgz ...
2018-12-29 16:04:04
7599
1
原创 python opencv获取视频属性方法
如果我们想知道一个视频的总帧数,可以借助opencv来实现: import cv2#path就是你的视频的地址,记得加引号cap=cv2.VideoCapture(path)#get方法参数按顺序对应下表(从0开始编号,比如这里为了获取视频的总帧数,在下表是排第八个的,不过cap.get里面的参数是从0开始计起frames_num=cap.get(7)print(frames_...
2018-11-27 21:49:05
4325
原创 caffe深度学习【十八】Check failed: error == cudaSuccess (8 vs. 0) invalid device function
今天想跑一下行为识别的C3D算法,但是发现出现如下错误:Check failed: error == cudaSuccess (8 vs. 0) invalid device function 查了下原因,网上说是最大能力编译版本不对,如果提示invaild argument,说明batchsize还是太大了,爆了缓存而我的是invalid device functi...
2018-11-26 16:35:56
2449
原创 Ubuntu16.04下安装ffmpeg
想跑行为识别的iDT算法时,需要依赖两个库:OpenCV: readme中推荐用2.4.2, 实际上用最新的2.4.13也没问题。但OpenCV3就不知道能不能用了,没有试过。 ffmpeg: readme中推荐用0.11.1。实际上装最新的版本也没有问题OpenCV很多人应该都装好的了FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或...
2018-11-22 09:47:21
1342
原创 LeetCode 17 电话号码的字母组合(字符串、回溯算法Backtracking、递归Recursive)
题目要求:给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。示例:输入:"23"输出:["ad", "ae", "af", "bd", "be", "bf", "cd", "ce", "cf"].说
2018-11-17 14:56:36
800
1
原创 人脸检测SSH(Single Stage Headless Face Detector)配置方法(caffe版)
SSH: Single Stage Headless Face Detector这篇是ICCV2017关于人脸检测的文章,提出SSH(single stage headless)算法有效提高了人脸检测的效果,主要改进点包括多尺度检测、引入更多的上下文信息、损失函数的分组传递等论文链接:https://arxiv.org/abs/1708.03979源码链接:https://github...
2018-11-16 17:38:39
1638
4
原创 LeetCode 16 最接近的三数之和(数组、双指针)
题目要求:给定一个包括 n 个整数的数组 nums 和 一个目标值 target。找出 nums 中的三个整数,使得它们的和与 target 最接近。返回这三个数的和。假定每组输入只存在唯一答案。例如,给定数组 nums = [-1,2,1,-4], 和 target = 1.与 target 最接近的三个数的和为 2. (-1 + 2 + 1 = 2). C++...
2018-11-15 17:05:42
217
原创 LeetCode 15 三数之和(数组、双指针)
题目要求:给定一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?找出所有满足条件且不重复的三元组。注意:答案中不可以包含重复的三元组。例如, 给定数组 nums = [-1, 0, 1, 2, -1, -4],满足要求的三元组集合为:[ [-1, 0, 1], [-1, -1, 2]] ...
2018-11-15 16:25:54
349
转载 人脸识别之人脸识别技术综述
参考:http://www.xuehuile.com/thesis/9a81f680054441ad907934b07b465c8e.html,本文做了相关修改。1 人脸识别技术概述 近年来,随着计算机技术的迅速发展,人脸自动识别技术得到广泛研究与开发,人脸识别成为近30年里模式识别和图像处理中最热门的研究主题之一。人脸识别的目的是从人脸图像中抽取人的个性化特征,并以此来识别人的身份...
2018-11-14 16:40:59
10255
原创 LeetCode 14 最长公共前缀(字符串)
题目要求:编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀,返回空字符串 ""。示例 1:输入: ["flower","flow","flight"]输出: "fl"示例 2:输入: ["dog","racecar","car"]输出: ""解释: 输入不存在公共前缀。说明:
2018-11-14 16:24:05
379
原创 LeetCode 13 罗马数字转整数(字符串)
题目要求:罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。字符 数值I 1V 5X 10L 50C 100D 500M 1000例如, 罗马数字 2 写做 II ,即为...
2018-11-14 11:13:50
318
原创 LeetCode 12 整数转罗马数字(字符串)
题目要求:罗马数字包含以下七种字符: I, V, X, L,C,D 和 M。字符 数值I 1V 5X 10L 50C 100D 500M 1000例如, 罗马数字 2 写做 II ,即为...
2018-11-14 10:20:49
287
原创 LeetCode 11 盛最多水的容器(数组、双指针)
题目要求:给定 n 个非负整数 a1,a2,...,an,每个数代表坐标中的一个点 (i, ai) 。在坐标内画 n 条垂直线,垂直线 i 的两个端点分别为 (i, ai) 和 (i, 0)。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。说明:你不能倾斜容器,且 n 的值至少为 2。图中垂直线代表输入数组 [1,8,6,2,5,4,8,3,7]。在此情况下,容...
2018-11-13 21:49:55
235
原创 LeetCode 9 回文数
题目要求:判断一个整数是否是回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。示例 1:输入: 121输出: true示例 2:输入: -121输出: false解释: 从左向右读, 为 -121 。 从右向左读, 为 121- 。因此它不是一个回文数。示例 3:输入: 10输出: false解释: 从右向左读, 为 01 。因此它不...
2018-11-13 20:56:10
198
原创 LeetCode 8 字符串转整数 (atoi)
题目要求:实现 atoi,将字符串转为整数。该函数首先根据需要丢弃任意多的空格字符,直到找到第一个非空格字符为止。如果第一个非空字符是正号或负号,选取该符号,并将其与后面尽可能多的连续的数字组合起来,这部分字符即为整数的值。如果第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。字符串可以在形成整数的字符后面包括多余的字符,这些字符可以被忽略,它们对于函数没有影响。...
2018-11-12 10:20:28
150
原创 LeetCode 7 反转整数
题目要求:给定一个 32 位有符号整数,将整数中的数字进行反转。示例 1:输入: 123输出: 321示例 2:输入: -123输出: -321示例 3:输入: 120输出: 21注意:假设我们的环境只能存储 32 位有符号整数,其数值范围是。根据这个假设,如果反转后的整数溢出,则返回 0。 C++代码1:#define I...
2018-11-07 17:52:26
170
原创 LeetCode 6 Z字形变换(字符串)
题目要求:将字符串 "PAYPALISHIRING" 以Z字形排列成给定的行数:P A H NA P L S I I GY I R之后从左往右,逐行读取字符:"PAHNAPLSIIGYIR"实现一个将字符串进行指定行数变换的函数:string convert(string s, int numRows);示例 1:输入: s = "PAYP...
2018-11-07 16:26:12
272
原创 LeetCode 5 最长回文子串(字符串、中心扩展)
题目要求:给定一个字符串 s,找到 s 中最长的回文子串。你可以假设 s 的最大长度为1000。示例 1:输入: "babad"输出: "bab"注意: "aba"也是一个有效答案。示例 2:输入: "cbbd"输出: "bb" 1.暴力解法最容易想到的就是暴力解法,找出所有的子串,然后再一个个去判断是不是回文,然后再从中找到最长的那个。求每一个...
2018-11-07 14:28:19
614
原创 LeetCode 4 两个排序数组的中位数(数组、二分查找、分治法)
题目要求:给定两个大小为 m 和 n 的有序数组 nums1 和 nums2 。请找出这两个有序数组的中位数。要求算法的时间复杂度为 O(log (m+n)) 。你可以假设 nums1 和 nums2 不同时为空。示例 1:nums1 = [1, 3]nums2 = [2]中位数是 2.0示例 2:nums1 = [1, 2]nums2 = [3, 4]...
2018-11-06 20:41:59
1582
原创 LeetCode 3 无重复字符的最长子串(哈希表或数组)
题目要求:给定一个字符串,找出不含有重复字符的最长子串的长度。示例 1:输入: "abcabcbb"输出: 3 解释: 无重复字符的最长子串是 "abc",其长度为 3。示例 2:输入: "bbbbb"输出: 1解释: 无重复字符的最长子串是 "b",其长度为 1。示例 3:输入: "pwwkew"输出: 3解释: 无重复字符的最长子串是 "wke&qu
2018-11-06 10:59:35
1190
原创 LeetCode 2 两数相加(链表)
题目要求:给定两个非空链表来表示两个非负整数。位数按照逆序方式存储,它们的每个节点只存储单个数字。将两数相加返回一个新的链表。你可以假设除了数字 0 之外,这两个数字都不会以零开头。示例:输入:(2 -> 4 -> 3) + (5 -> 6 -> 4)输出:7 -> 0 -> 8原因:342 + 465 = 807 C++代码...
2018-11-05 23:15:04
2700
原创 LeetCode 1 两数之和(哈希表、unordered_map)
题目要求:给定一个整数数组和一个目标值,找出数组中和为目标值的两个数。你可以假设每个输入只对应一种答案,且同样的元素不能被重复利用。示例:给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1] C++代码(8ms):class Solution ...
2018-11-05 16:01:58
2687
原创 unordered_map的用法
unordered_map介绍:无序映射是关联容器,用于存储由键值和映射值组合而成的元素,并允许基于键快速检索各个元素。 在unordered_map中,键值通常用于唯一标识元素,而映射值是与该键关联的内容的对象。键和映射值的类型可能不同。 在内部,unordered_map中的元素没有按照它们的键值或映射值的任何顺序排序,而是根据它们的散列值组织成桶以允许通过它们的键值直接快速访问单个...
2018-11-05 14:58:38
3897
原创 行人重识别(Person Re-ID)【五】:论文笔记——Pose-Normalized Image Generation for Person Re-identification
论文:Pose-Normalized Image Generation for Person Re-identification链接:http://openaccess.thecvf.com/content_ECCV_2018/papers/Xuelin_Qian_Pose-Normalized_Image_Generation_ECCV_2018_paper.pdf代码:暂无 ...
2018-10-29 16:49:02
2795
2
原创 行人重识别(Person Re-ID)【四】:论文笔记——Beyond Part Models: Person Retrieval with Refined Part Pooling
论文:Beyond Part Models: Person Retrieval with Refined Part Pooling链接:http://openaccess.thecvf.com/content_ECCV_2018/papers/Yifan_Sun_Beyond_Part_Models_ECCV_2018_paper.pdf代码:https://github.com/syfa...
2018-10-24 15:12:06
7227
1
原创 Ubuntu(Linux)系统下如何查看自己安装的CUDA和CUDNN的版本
一、查看 CUDA 版本:cat /usr/local/cuda/version.txt我的是8.0.61 二、查看 CUDNN 版本:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2我的是6.0.21
2018-10-23 10:03:11
46466
11
原创 行人重识别(Person Re-ID)【三】:论文笔记——Joint Detection and Identification Feature Learning for Person Search
论文:Joint Detection and Identification Feature Learning for Person Search链接:https://arxiv.org/abs/1604.01850 前言:这篇是CVPR2017关于行人重识别(Person Re-ID)的文章,由港中文、中山大学和商汤联合提出。本文主要提出了一种行人搜索的新框架,把传统的两门独立的研究...
2018-10-14 15:45:55
9744
原创 Windows下的labelme数据标注工具安装教程
前言因为最近要做一个目标检测的比赛,需要用到labelme这款开源标注工具,所以安装了下具体的的安装步骤可参考:https://github.com/wkentaro/labelme因为我是在Windows下使用的,所以这里只介绍了Windows的安装方法,Ubuntu、macOS等其他系统在上面的github都有详细介绍,大家自行查看哈 一、安装AnacondaWindo...
2018-10-13 11:21:18
55548
34
原创 caffe深度学习【十七】配置MobileNet,caffe添加ConvolutionDepthwise层
背景:论文入口:https://arxiv.org/abs/1704.04861配置文件下载入口:https://github.com/farmingyard/caffe-mobilenet 在caffe版本的MobileNet 和ShuufleNet中,我们会用到ConvolutionDepthwise层,即深度可分离卷积。Caffe原本的框架里是没有Convolut...
2018-09-12 16:39:38
7367
11
opencv-离散傅里叶变换
2017-09-20
opencv-模板匹配
2017-09-20
opencv-分水岭算法
2017-09-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人