- 博客(36)
- 资源 (7)
- 收藏
- 关注
原创 LaTeX 系列(5) —— 特殊符号
1. 导入所需的包\usepackage{pifont} % \ding{xx}\usepackage{bbding} % \Checkmark,\XSolid,... (需要和pifont宏包共同使用)\usepackage{fontawesome} % \faCheck,\faTimes2. 打勾打叉latex代码:\checkmark\Checkmark\CheckmarkBold\XSolid\XSolidBold\XSolidBrush
2022-04-28 23:36:04
9306
1
原创 LaTeX 系列(4) —— Table
接上一篇LaTeX 系列(3) —— Figure,这篇文章介绍Latex中的各种Table样式和排版的实现。1.导入所需的包全部导入就完事了:\usepackage{booktabs} % toprule, midrule, bottomrule\usepackage{multirow} % multirow, multicolumn\usepackage{graphicx} % resizebox\usepackage{threeparttable} % footnot...
2022-04-18 16:53:57
1650
原创 LaTeX 系列(3) —— Figure
使用Latex的时候经常需要绘制各种图示,但是一直记不清,每次要用的时候都去找模板还是挺麻烦的,所以在这里总结一下常用的几种Figure类型。1.导入所需的包不管画什么图,全部导入就完事了:\usepackage{graphicx}\usepackage{float}\usepackage{subfig}\usepackage{overpic}2.1 单张图片显示Latex代码:% 单张图片显示\begin{figure}\centering\includegrap.
2021-11-25 14:57:00
15637
2
原创 数据结构和算法笔记(2)基础算法模板
有很多的基础算法经常会用到,但是又容易写错。而网上查到的实现又五花八门、良莠不齐,故在此整理记录。本文的目录如下:1.二分查找1.二分查找一个细节就是计算middle时,用 (left + right) / 2 容易数值溢出,所以改成 middle = left + (right - left) / 2.c++实现:#define LEFT_BOUND 0#def...
2020-02-07 00:18:17
295
原创 基于深度学习的低光照图像增强方法总结(2020.09.15更新)
之前在做光照对于高层视觉任务的影响的相关工作,看了不少基于深度学习的低光照增强(low-light enhancement)的文章[3,4,5,7,8,9,10],于是决定简单梳理一下。光照估计(illumination estimation)和低光照增强(low-light enhancement)的区别:光照估计是一个专门的底层视觉任务(例如[1,2,6]),它的输出结果可以被用到其它任务...
2019-08-15 16:29:21
29885
12
原创 编程时踩过的坑(主要是c++)
1.数值溢出存储数据时要考虑数值溢出的问题,选择合适的类型,特别要注意数值运算时的数值范围是否合适。比方说,如果使用了int类型,尽管数据本身没有超范围,但是在进行乘法计算时却可能会产生数值溢出。c++类型的数值范围速查表:Type Typical Bit Width Typical Range char 1byte -127 to 127 or 0 to ...
2019-07-17 14:49:53
850
1
原创 数据结构和算法笔记(1)数论相关
最近在刷编程题,发现了许多杂七杂八的知识点,稍微归类并记录下来方便后续查阅。本文的目录如下:1.组合数 2.快速幂 3.大数取模(乘法逆元和费马小定理) 4.菲波拉契数列1.组合数的求法组合数,为了方便也写作C(n, k),表示从n个不同元素中取出k (k≤n)个元素的所有组合的个数。我们知道存在公式C(n, k) = [n*(n-1)*(n-2)*.....
2019-07-10 17:44:44
586
原创 PyTorch中的padding(边缘填充)操作
简介我们知道,在对图像执行卷积操作时,如果不对图像边缘进行填充,卷积核将无法到达图像边缘的像素,而且卷积前后图像的尺寸也会发生变化,这会造成许多麻烦。因此现在各大深度学习框架的卷积层实现上基本都配备了padding操作,以保证图像输入输出前后的尺寸大小不变。例如,若卷积核大小为3x3,那么就应该设定padding=1,即填充1层边缘像素;若卷积核大小为7x7,那么就应该设定padding=...
2019-07-02 16:16:58
51449
5
原创 人体解析任务 和 Look into Person数据集 (附源码分享)
人体解析任务人体解析(human parsing),属于语义分割任务的子任务,旨在对人类图像进行像素级的是细粒度分割(例如,划分出身体部位和服装)。根据不同的场景,又可以分为单人人体解析(single-person human parsing)和多人人体解析(multi-person human parsing,或者 instance-level human parsing)。除此之外,按照处...
2019-06-14 15:38:37
8950
6
原创 python列表的三种拷贝方式的性能分析
对于一个很大的列表,如果要对其进行复制,那么有三种方式可以选择。第一种是直接用for循环复制,第二、第三种则是使用python自带的copy和deepcopy方法。copy和deepcopy的区别在于,copy仅仅对被复制对象本身的值进行复制,而deepcopy则还会对被复制对象的所有子对象进行递归和拷贝。举例来说,如果一个字典里的value里包含了列表,那么在复制这个字典时,deepco...
2019-04-26 12:56:09
1033
原创 LaTeX 系列(2) —— 中文支持
本文内容基于 Ubuntu16.04 和 TexLive 2018.对于完整安装的TexLive2018, 应该是已经包含了中文支持的,使用 xeCJK 宏包即可。我们可以测试一下以下代码:\documentclass{article}\usepackage{xeCJK}% use buildin Chinese font in linux\setCJKmainfont{We...
2019-04-20 18:23:55
1634
原创 Domain Adaptation through Synthesis for Unsupervised Person Re-identification 论文笔记
这篇文章来自ECCV2018. 主要针对无监督的行人再识别任务,首先用3D引擎和环境渲染技术构建了一个多光照条件的虚拟行人数据集,接着用该合成数据集和其它大型真实数据集合并,共同预训练了一个模型。由于涵盖了各种光照情况,该模型具有良好的泛化性能。为了进一步提升无监督性能,该文章提出了一种域自适应技术(有约束的cycleGAN),选择和目标域的光照情况最相似的那些合成图像,迁移到目标域上,再利用迁移...
2019-02-22 17:13:25
1761
原创 损失函数SSIM (structural similarity index) 的PyTorch实现
SSIM介绍结构相似性指数(structural similarity index,SSIM), 出自参考文献[1],用于度量两幅图像间的结构相似性。和被广泛采用的L2 loss不同,SSIM和人类的视觉系统(HVS)类似,对局部结构变化的感知敏感。SSIM分为三个部分:照明度、对比度、结构,分别如下公式所示:将上面三个式子汇总到一起就是SSIM:其中,上式各符号分...
2019-02-21 20:56:33
44876
35
原创 PyTorch的可重复性问题 (如何使实验结果可复现)
由于在模型训练的过程中存在大量的随机操作,使得对于同一份代码,重复运行后得到的结果不一致。因此,为了得到可重复的实验结果,我们需要对随机数生成器设置一个固定的种子。许多博客都有介绍如何解决这个问题,但是很多都不够全面,往往不能保证结果精确一致。我经过许多调研和实验,总结了以下方法,记录下来。全部设置可以分为三部分: 1. CUDNNcudnn中对卷积操作进行了优化,牺牲了精度来...
2018-11-20 20:53:12
21590
26
原创 网络调参时踩过的坑(长期更新)
1.学习率大小的设置一般情况下,当网络收敛到一定程度时,loss曲线的变化不明显,并出现上下的小幅度波动,这时候可以考虑调小学习率,帮助网络进一步收敛到最优值。如下图所示:但有些情况,网络看似收敛了,但实际上是到了某些平坦的曲面,离最优值还有一段距离。典型的loss curve如下图所示:可以观察到,曲线还在非常稳定地缓慢下降,并且没有上下波动。这时不要误以为网络已经收敛,而要...
2018-09-15 16:35:07
525
原创 卷积神经网络的权值初始化方法
卷积层:normal 从均值为0,方差为1的高斯分布中采样,作为初始权值。PyTorch中的相关函数如下:torch.nn.init.normal_(tensor, mean=0, std=1)kaiming_normal 由FAIR的大牛Kaiming He提出来的卷积层权值初始化方法,目的是使得每一卷积层的输出的方差都为1,具体数学推导可以参考论文[1]. 权值的初始化方...
2018-08-28 14:07:56
20509
原创 Linux Ubuntu 笔记(长期更新)
软链接、硬链接:前者相当于快捷方式,后者则相当于重新拷贝了一次。软链接命令:ln -s /home/sb/a /home/sb/b注意!删除软链接时,注意rm a 和 rm -r a/的区别,后者会将源文件夹也删除,血的教训。批删除文件:sudo find . -name 'xxx.tmp' | xargs sudo rm -rf支持通配符和正则表达式。...
2018-08-17 14:20:03
332
翻译 ICCV2015论文翻译 Scalable Person Re-identification: A Benchmark
网页的排版效果不好,可以从以下链接下载pdf版本:https://download.youkuaiyun.com/download/hyk_1996/10602389 Scalable Person Re-identification: A Benchmark可拓展的行人重识别:一个基准 摘要这篇论文贡献了一个新的用于行人重识别领域的高质量数据集,称为“Market-1501”.一...
2018-08-14 10:20:27
3583
原创 行人重识别 MSMT17数据集描述
最近的CVPR2018会议上,提出了一个新的更接近真实场景的大型数据集MSMT17,即Multi-Scene Multi-Time,涵盖了多场景多时段。 早期数据集的缺点(1)和实际的监控网络相比,数据集中行人和摄像头的数目不多;(2)大多数数据集仅覆盖单一场景;(3)时间跨度短,没有显著的光照变化;(4)行人检测器有昂贵的人工标注或过时的DPM模型实现。...
2018-08-12 16:52:04
24381
35
原创 论文笔记的格式
关于阅读文献 采用三步走的方法,而不是逐字逐句的全文阅读。第一步阅读让你对文献的主要想法有一个了解,判断该文献是否值得阅读(自己掌握的知识是否足够理解该文献);第二步阅读文献内容,而不是细节,做文献调研的话,到这一步就足够了;第三步是深入理解细节,以期望能够复现论文结果。 第一步,快速浏览,从而获得对文献的一个全局的把握,需要仔细地阅读文章标题、摘要、导论,以及各章节的标题。这...
2018-07-23 13:20:47
1667
转载 2017 深度学习语义分割指南
A 2017 Guide to Semantic Segmentation with Deep LearningSasank Chilamkurthy | July 5, 2017At Qure, we regularly work on segmentation and object detection problems and we were therefore interested ...
2018-07-18 13:53:04
1150
原创 PyTorch踩过的坑(长期更新,转载请注明出处)
最近在知乎看到有人转载了这里的内容,提醒一下,欢迎转载,但是请注明出处,谢谢。1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差异无论是对于模型还是数据,cuda()函数都能实现从CPU到GPU的内存迁移,但是他们的作用效果有所不同。对于nn.Module:model = model.cuda()model.cuda()上面两句能...
2018-06-27 10:43:48
30929
9
原创 LaTeX 系列(1) —— 介绍、安装和使用
撰写学术论文,经常会听人提到的一个排版工具就是LaTeX,于是今天就来入坑学习一下这个神奇的工具。本文主要基于Windows系统,先简单体验一下。介绍TeX是一个排版工具,然后LaTeX是基于TeX的宏集。基于TeX的各种衍生实在是太多了,这篇博客有一个很好的介绍。我们要记住的就是,宏集(LaTeX、plain TeX)相当于编程语言,引擎相当于编译器(XeTeX、pdfTeX). 发行版就是一个...
2018-06-16 13:58:23
4503
转载 转载-自动微分(Automatic Differentiation)入门教程
转载自https://blog.youkuaiyun.com/aws3217150/article/details/70214422 现代深度学习系统中(比如MXNet, TensorFlow等)都用到了一种技术——自动微分。在此之前,机器学习社区中很少发挥这个利器,一般都是用Backpropagation进行梯度求解,然后进行...
2018-05-30 15:14:33
733
翻译 CVPR2018论文翻译 Human Semantic Parsing for Person Re-identification
论文链接:https://arxiv.org/pdf/1804.00216.pdf摘要 混乱的背景、光照、视角等因素制约了提取鲁棒性表示的能力,因此reid是个挑战性的任务。为了改进表示学习,通常提取行人身体各部分的局部特征。然而,实际中通常基于包围框的部分检测。本文提出了改编的human semantic parsing,它有着像素等级的精确率和建模任意轮廓的能力,因此一个很好的选择。 ...
2018-05-21 23:18:39
2885
原创 Horizontal Pyramid Matching for Person Re-identification 论文笔记
Motivation Failure cases where the discriminative body parts (key parts) are missing.Contribution 1. horizontal pyramid scales (增强body parts的判别能力) 2. average and max pooling strategies 3. ...
2018-05-21 20:30:02
2404
9
原创 行人属性识别 PETA数据集
数据集主页(内含数据集下载地址):http://mmlab.ie.cuhk.edu.hk/projects/PETA.html百度网盘连接:链接: https://pan.baidu.com/s/1Yt47VmpozNSYI3DDxzZtVA 密码: qkbj描述: PETA (PEdesTrian Attribute)数据集包含了8705个行人,共19000张图像(分辨...
2018-05-15 15:02:44
13367
7
原创 Re-ranking Person Re-identification with k-reciprocal Encoding 重排序算法解析
论文:Re-ranking Person Re-identification with k-reciprocal Encoding代码:https://github.com/layumi/Person_reID_baseline_pytorch/blob/master/re_ranking.py3.提出的方法3.1问题定义给定probeperson和gal...
2018-04-08 11:29:51
7798
5
原创 度量学习方法 - KISSME
KISSME(keep it simple and straightforward metric), 属于有监督的线性度量学习方法,本质上还是学习马氏距离中的矩阵M.推导 首先,认为对于样本对,它们之间的差异程度(dissimilar)可以通过似然比检验(likelihood ratio test)来观测,如下式所示: 其中,H0假设该样本对为负样本对(...
2018-03-21 14:26:18
7721
原创 LBP特征及其变体和python实现
一. LBP特征LBP(Local Binary Pattern),局部二值模式,主要用于提取纹理特征,根据文献[1]我们可以了解到LBP及其变体。一般的使用方法是,先将图像转换为灰度图,接着计算LBP特征图,最后计算其直方图作为特征向量。0.如何描述纹理信息 不多说,看图。LBP特征可以表示平坦、边缘、角点等区域。1.original LB...
2018-03-19 23:07:50
12524
12
原创 行人重识别 VIPeR数据集描述
VIPeR数据集包括632个行人的1264张图像,每个行人有两张图像,采集自摄像头a和摄像头b. 每张图像都调整为了128x48的大小。该数据集的特点为视角和光照的多样性。参考论文:D. Gray, and H. Tao, "Viewpoint Invariant Pedestrian Recognition with an Ensemble of Localized Features,"...
2018-03-16 17:31:35
7165
1
原创 Huber Loss 及 tensorflow实现
Huber Loss 相当于平方误差的推广,通过设置delta的值,使损失函数鲁棒性更强,从而减弱离群点(outliers)对模型的影响。当delta为无穷大时,Huber Loss 退化为Squared Loss.解释:Huber Loss对平方损失进行了分段,分为平方损失和线性损失。当偏差小于δ时,为平方损失,当偏差大于δ时,为线性损失。由于离群点往往具有很大的偏差,因此会...
2018-03-15 17:22:33
6518
1
原创 CUHK数据集和Market-1501数据集计算CMC方法的差别
Cumulative Matching Characteristics (CMC) curves 是目前行人重识别领域最流行的性能评估方法。考虑一个简单的 single-gallery-shot 情形,每个gallery identity只有一个instance. 对于每一次的query, 算法将根据 query 到所有gallery samples的距离从小到大排序,CMC top-k accu...
2018-03-06 13:21:45
8225
原创 行人重识别 CUHK03数据集描述
简要描述:MATLAB数据文件格式,1467个行人,收集自The Chinese University of Hong Kong校园内的10个(5对)不同的摄像头。 数据集结构:由三部分组成:--- "detected":行人框由pedestrian detector绘出,5x1 cell,分别由5对摄像头组收集得到。 -- 843x10 cell,收集自...
2018-02-27 13:45:53
20514
原创 Ubuntu16.04 nvidia显卡驱动 cuda9.0 cudnn7.0.5 简要配置流程
一.安装显卡驱动直接使用Ubuntu自带的 附加驱动 来安装最新版Nvidia闭源驱动,能省下许多麻烦; 但是如果还要安装primus(bumblebee)进行双显卡切换的话,则应让primus自行安装对应驱动,否则会安装配置失败(大坑)。二.CUDA安装1. 安装完显卡驱动后,再到官网下载cuda runfile文件安装CUDA,按提示操作,非常简单。但注意不要重复安装显卡驱动。2. cuda ...
2018-02-21 15:40:38
1083
翻译 Voice Conversion using Convolutional Neural Networks 翻译
原文来自arXiv.org (Mobin S, Bruna J. Voice Conversion using Convolutional Neural Networks[J]. 2016.)摘要:除了音调外,音色是识别说话人的关键,但我们对此了解不多。在这篇论文我们利用神经网络来变换说话人声音。(不仅转换说话人音调,还包括了音色的转换)。我们用能够学习类比的神经网络结构来构建生成模型。
2017-07-27 16:43:58
762
Scalable Person Re-identification: A Benchmark 外文翻译
2018-08-14
空中写字与数字识别
2017-04-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人