
CV论文笔记
文章平均质量分 86
记录已读的计算机视觉和机器学习相关的论文,或记录主要内容,或记录算法流程和细节。
养成好的习惯,有的放矢,在写博客的过程中能够促进思考和写作能力,同时也是一个交流和学习的平台。
有来有去-CV
喜欢计算机视觉,特别羡慕那些牛人,天分不高,只能靠专注和坚持。
今天比昨天好就是最大的进步。
展开
-
【论文笔记】Additive Margin Softmax for Face Verification
之前的L-Softmax, A-Softmax引入了角间距的概念,用于改进传统的softmax loss函数,使得人脸特征具有更大的类间距和更小的类内距。作者在这些方法的启发下,提出了一种更直观和更易解释的additive margin Softmax (AM-Softmax)。原创 2018-01-28 21:28:33 · 9557 阅读 · 0 评论 -
【论文笔记】Two Birds with One Stone: Iteratively Learn Facial Attributes with GANs
GAN在生成高保真度的变换图方面具有其它方法所没有的优势。在这篇文章里,作者通过集成的损失函数来正则化最小最大过程,从而完成GAN模型的训练。这个集成的损失函数不仅包括像素级loss,而且包括既能提高生成图片质量又能保留身份信息的感知loss。原创 2018-01-21 22:30:21 · 738 阅读 · 0 评论 -
【论文笔记】VGGFace2——一个能够用于识别不同姿态和年龄人脸的数据集
.VGGFace2 是一个大规模人脸识别数据,包含331万图片,9131个ID,平均图片个数为362.6。原创 2018-01-10 14:53:31 · 30903 阅读 · 7 评论 -
【论文笔记】SphereFace: Deep Hypersphere Embedding for Face Recognition
这篇paper提出Angular-Softmax(A-Softmax)去学习判别特征,它在超球面流形上强加了一个判别约束,而这个超球面流形本质上与人脸的先验知识位于同一个流形上。原创 2017-12-24 14:55:13 · 4717 阅读 · 1 评论 -
【论文笔记】GAN-摘要-201709
【1】Huang R, Zhang S, Li T, et al. Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis[J]. arXiv preprint arXiv:1704.04086, 2017.TP-GA原创 2017-09-20 13:09:35 · 1873 阅读 · 0 评论 -
【论文笔记】Large-Margin Softmax Loss for Convolutional Neural Networks
参考文献: Liu W, Wen Y, Yu Z, et al. Large-Margin Softmax Loss for Convolutional Neural Networks[C]//Proceedings of The 33rd International Conference on Machine Learning. 2016: 507-516.摘要Softmax Loss 函数经原创 2016-11-25 21:54:36 · 13468 阅读 · 4 评论 -
【论文笔记】Object Tracking_简略版_201608
【1】Held, D., Thrun, S., & Savarese, S. (2016). Learning to Track at 100 FPS with Deep Regression Networks. arXiv preprint arXiv:1604.01802.这篇文章提出了一种基于深度学习的目标跟踪算法,有以下几个特点: 1)快,100fps,比之前大多数采用深度学习的跟踪原创 2016-08-16 15:06:50 · 1724 阅读 · 5 评论 -
【论文笔记】Spatial Transformer Networks
卷积神经网络(CNN)已经被证明能够训练一个能力强大的分类模型,但与传统的模式识别方法类似,它也会受到数据在空间上多样性的影响。这篇Paper提出了一种叫做空间变换网络(Spatial Transform Networks, STN),该网络不需要关键点的标定,能够根据分类或者其它任务自适应地将数据进行空间变换和对齐(包括平移、缩放、旋转以及其它几何变换等)。原创 2016-07-02 12:46:04 · 33687 阅读 · 7 评论 -
【论文笔记】未分类_2016
【1】Kemelmacher-Shlizerman I, Seitz S M. Collection flow[C]//Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012: 1792-1799.计算一对人脸图像(I,J)(I, J)之间的光流,容易受到光照、姿态以及其它变化的影响。作者原创 2016-06-29 17:24:37 · 3691 阅读 · 0 评论 -
【论文笔记】Text-Recognition_简略版_201606
【1】Shi B, Wang X, Lv P, et al. Robust Scene Text Recognition with Automatic Rectification[J]. arXiv preprint arXiv:1603.03915, 2016. 上图即为本篇论文的系统框架:包括 Spatial Transformer Network (STN ) 以及 Sequence Reco原创 2016-06-28 10:13:34 · 4814 阅读 · 5 评论 -
【论文笔记】Text-Detection_简略版_201604
最近在研究一个新课题-Text Detection,正在读论文中。。。201604261、Zhang Z, Zhang C, Shen W, et al. Multi-Oriented Text Detection with Fully Convolutional Networks[J]. arXiv preprint arXiv:1604.04018, 2016.这篇文章将局部和全局信息结合,使用原创 2016-04-26 17:31:54 · 11489 阅读 · 1 评论 -
【论文笔记】人脸关键点检测_简略版_2016
20160331 1、Zhang Z, Luo P, Loy C C, et al. Learning deep representation for face alignment with auxiliary attributes[J]. 2015.在论文“Facial landmark detection by deep multi-task learning”上的改进(见http://blo原创 2016-03-31 09:55:38 · 7973 阅读 · 0 评论 -
【论文笔记】Leveraging Datasets with Varying Annotations for Face Alignment via Deep Regression Network
参考文献: Zhang J, Kan M, Shan S, et al. Leveraging Datasets With Varying Annotations for Face Alignment via Deep Regression Network[C]//Proceedings of the IEEE International Conference on Computer Visio原创 2016-03-20 17:08:37 · 2981 阅读 · 1 评论 -
【论文笔记】3D人脸重建_简略版(时时更新中)
201601161. Zhu X, Lei Z, Yan J, et al. High-Fidelity Pose and Expression Normalization for Face Recognition in the Wild[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition原创 2016-02-21 15:01:20 · 5797 阅读 · 0 评论 -
【论文笔记】人脸关键点检测_简略版(时时更新中...)
201601151. Jourabloo A, Liu X. Pose-invariant 3d face alignment[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 3694-3702.PIFA通过一个可变的人脸3D模型,在回归过程中引入更多的变量,如摄像头投影矩阵、3D关键点等,原创 2016-01-15 18:06:17 · 5057 阅读 · 0 评论 -
【论文笔记】One Millisecond Face Alignment with an Ensemble of Regression Trees
简介CVPR 2014的一篇关于人脸关键点检测的论文,基于Ensemble of Regression Tress算法(以下简称 ESR),速度极快(单人人脸关键点检测耗时约为1ms),效果也不错。同时又能处理训练集中部分关键点标定缺失的情况。原创 2016-01-10 16:56:05 · 15093 阅读 · 17 评论 -
写在Paper Reading之前
写在Paper Reading 之前2016年第一篇文章,就以paper reading开头,这段时间最少写五篇,达到申请专栏的条件。通过申请专栏,也可以达到监督作用,催促自己多看、多想、多写。【1】每周一篇CV论文阅读笔记,多则不限。 【2】理清文章思路,尽可能将流程解释清楚。 【3】阐述自己读后的思考。 【4】写清楚文献出处,便于之后写论文引用。由于自己理解不深,会时常犯错,这也是展示错误原创 2016-01-04 19:35:42 · 1743 阅读 · 0 评论