
论文笔记
文章平均质量分 77
迷川浩浩_ZJU
luohao.site
展开
-
【论文笔记】Video2Vec: Learning Semantic Spatial-Temporal Embeddings for Video Representation
摘要翻译这篇论文我们提出了一种视频片段的语义和时空信息嵌入(embedding)方法。视频作为语义连续的时序列帧,我们借助视频的这个特点来表达视频的高层特征(备注,视频和图像的高层特征通常就是指understanding层面)。我们的网络提取CNN的特征并且训练了两个学习视频的文本信息地独立GRU编码器,此外我们还把视频的彩色图像序列和光流序列嵌入到相同尺寸的表征向量(representation)原创 2017-03-13 16:21:45 · 2756 阅读 · 1 评论 -
【论文笔记】Unsupervised Learning of Video Representations using LSTMs
这篇文章是深度学习应用在视频分析领域的经典文章,也是Encoder-Decoder模型的经典文章,作者是多伦多大学深度学习开山鼻祖Hinton教授的徒子徒孙们,引用量非常高,是视频分析领域的必读文章。摘要翻译我们使用长短时记忆(Long Short Term Memory, LSTM)网络来学习视频序列的表征。我们的模型使用LSTM编码器将输入序列映射到一个固定长度的表征向量。之后我们用一个或多个L原创 2017-03-26 21:21:41 · 9651 阅读 · 1 评论 -
Mac终端Iterm2快捷键大全
标签新建标签:command + t关闭标签:command + w切换标签:command + 数字 command + 左右方向键切换全屏:command + enter查找:command + f原创 2017-07-25 22:47:08 · 4701 阅读 · 0 评论 -
【论文笔记】Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification
摘要Person re-identification (ReID) is an important task in computer vision. Recently, deep learning with a metric learning loss has become a common framework for ReID. In this paper, we propose a new me原创 2017-11-07 14:12:22 · 4828 阅读 · 5 评论 -
【论文笔记】Neural Person Search Machines (ICCV2017)
摘要作者调查了一下室外真实场景下的Person ReID工作,大部分相关工作都是detection+ReID分成两步来做的,这篇文章提出NPSM方法来实现一步到位。NPSM主要借助LSTM和attention的思想,逐步衰减原图中所应该关注的ROI区域,直到最后得到一个很精确的ROI区域,这个区域就是应该搜索的person目标。实验结果表明,在CUHK-SYSU和PWR数据集上都取得了State-o原创 2017-11-08 21:55:36 · 5696 阅读 · 3 评论 -
【论文笔记】In Defense of the Triplet Loss for Person Re-Identification
1、前言Triplet loss是非常常用的一种deep metric learning方法,在图像检索领域有非常广泛的应用,比如人脸识别、行人重识别、商品检索等。传统的triplet loss训练需要一个三元组,包括三张图片:achor,positive,negative,分别简写为a,p,n。==Triplet loss的缺点在于随机从训练集中挑选出三张图片,那么可能会出现挑选出来的很可能是简单原创 2017-11-01 18:46:50 · 11889 阅读 · 6 评论 -
【论文笔记】CycleGAN
前言: CycleGAN是发表于ICCV17的一篇GAN工作,可以让两个domain的图片互相转化。传统的GAN是单向生成,而CycleGAN是互相生成,网络是个环形,所以命名为Cycle。并且CycleGAN一个非常实用的地方就是输入的两张图片可以是任意的两张图片,也就是unpaired。单向GAN读者可以按照原论文的顺序理解CycleGAN,这里我按照自己的思路解读。CycleGAN本质上是两个原创 2017-12-14 22:13:14 · 50474 阅读 · 18 评论 -
【论文笔记】Person Transfer GAN to Bridge Domain Gap for Person Re-Identification
摘要本文提出了一种针对于ReID的生成对抗网络PTGAN,可以实现不同ReID数据集的行人图片迁移,在保证行人本体前景不变的情况下,将背景转换成期望的数据集style。另外本文还提出一个大型的ReID数据集MSMT17,这个数据集包括多个时间段多个场景,包括室内和室外场景,是一个非常有挑战的数据集。论文用PTGAN来缩小不同数据集间的domain gap,并在新提出的MSMT17这个大数据集和原创 2018-01-23 22:37:54 · 7833 阅读 · 12 评论