
Computer Vision
文章平均质量分 64
tinyzhao
这个作者很懒,什么都没留下…
展开
-
人脸检测:MTCNN
《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》论文解读。本文来自于中国科学院深圳先进技术研究院,目前发表在arXiv上,是2016年4月份的文章,算是比较新的文章。 论文地址: https://kpzhang93.github.io/MTCNN_face_detectio原创 2016-11-19 23:01:02 · 52455 阅读 · 12 评论 -
人脸识别系统概述
一个人脸识别系统分为: 人脸检测,人脸特征点检测,人脸对齐,人脸认证原创 2016-11-18 17:16:22 · 6453 阅读 · 0 评论 -
人脸检测:Viola-Jones
《Robust Real-Time Face Detection》论文解读这篇论文实现了实时的人脸检测算法,是人脸检测这一问题最重要的一篇论文之一,现在的OpenCV中人脸检测的方法就是基于这一论文。概述目标检测问题框架中有三个问题:1、如何选择待检测区域;2、如何提取目标特征;3如何判断是不是指定对象。针对这三个问题,Viola-Jones给出的答案是:滑动窗口法,Haar-like特征和Casc原创 2016-11-15 20:14:39 · 4919 阅读 · 0 评论 -
人脸对齐:Procrustes analysis
概述在人脸相关应用中,获得的人脸图像常常形状各异,这时就需要对人脸形状进行归一化处理。人脸对齐就是将两个不同的形状进行归一化的过程,将一个形状尽可能地贴近另一个形状。值得注意的是,在英语文献中,Face Alignment和Facial Landmark Detection常常混用,在我的系列博客里面,Facial Landmark Detection指的是人脸特征点检测,而Face Alignme原创 2016-11-15 11:50:04 · 20799 阅读 · 13 评论 -
人脸特征点检测:SDM
《Supervised Descent Method and its Applications to Face Alignment》论文解读这篇文章发表于CVPR2013,来自于CMU。论文原文见: http://www.ri.cmu.edu/publication_view.html?pub_id=7428概述许多机器学习问题可以看做是一个非线性优化问题。所谓非线性优化问题就是约束条件或者目原创 2016-11-03 00:13:21 · 11111 阅读 · 2 评论 -
人脸验证:DeepID
《Deep Learning Face Representation from Predicting 10000 Classes》论文解读本文来自香港中文大学汤晓鸥课题组。人脸验证(Face Verification)就是判断两个人脸是不是同一个人,一个常用的场景是判断身份证是不是本人。概述文章使用深度学习的方法来提取人脸高级特征(high-level features),这种特征被称为DeepID原创 2016-11-01 23:19:39 · 10826 阅读 · 2 评论 -
人脸验证:Joint Bayesian
《Bayesian Face Revisited: A Joint Formulation》论文解读这篇文章发表于ECCV2012,来自MSRA的孙剑组。论文原文见: http://home.ustc.edu.cn/~chendong/JointBayesian/概述经典的贝叶斯人脸识别方法是为两个人脸的差异进行建模,但是作者看到这种为差异建模的方法降低了可分性。本文将两个人脸进行联合建模,并原创 2016-11-03 00:05:36 · 10583 阅读 · 1 评论 -
人脸特征点检测:TCDCN
这篇文章发表于ECCV2014,作者单位是香港中文大学汤晓鸥课题组。论文原文见: http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.html概述文章提出了人脸特征点检测的新方法,使用与人脸相关的属性共同学习人脸的特征点位置。 we wish to optimize facial landmark detection together with heter原创 2016-10-03 23:59:38 · 14457 阅读 · 5 评论 -
人脸3D重建:Cascaded Regressor
《Cascaded Regressor based 3D Face Reconstruction from a Single Arbitrary View Image》论文解读本文来自四川大学,论文原文: https://arxiv.org/abs/1509.06161v1人脸3D重建就是从一张或多张照片中重建出人脸的3D的模型。本文提出了回归框架下的人脸3D重建,这篇文章给我的感觉就是SDM原创 2016-12-14 15:58:51 · 9149 阅读 · 3 评论 -
目标检测:R-CNN
《Rich feature hierarchies for accurate object detection and semantic segmentation》论文解读目标检测问题就是从图片中检测出目标的位置并判断目标的类别,比如人脸检测问题。不过人脸检测问题只是一种专门针对人脸的检测问题,而本文提出的R-CNN是通用目标检测问题,针对20类目标的检测。通用目标检测问题只需要进行适当修改就可以应原创 2016-12-17 23:35:16 · 4158 阅读 · 0 评论 -
OpenCV3 for Python3的安装方法
官方的OpenCV版本只支持到了Python2.X,如果要使用Python3就需要自己编译。本文将阐述如何在Windows和Ubuntu系统下安装OpenCV3 for Python3 。原创 2016-10-05 14:14:52 · 8780 阅读 · 0 评论 -
EVM算法的Python实现
EVM(Eulerian Video Magnification,欧拉视频放大或欧拉影像放大)是一种将视频中的微小变化进行放大的算法,正如论文标题所说《Eulerian Video Magnification for Revealing Subtle Changes in the World》,该算法可以将视频中的微小变化转变为肉眼可以原创 2016-09-27 15:36:16 · 15192 阅读 · 23 评论 -
Caffe模型移植到MXNet
使用caffe的一大好处是有很多的预训练模型,你可以从caffe的model zoo去下载这些模型。那么怎样把caffe的模型转到MXNet中呢?一种最简单也是最有效的方法就是把caffe的模型加载出来,然后对照着模型参数,逐个复制到MXNet对应的模型参数中。这种方法简单有效,但是也是工作量比较大的一种方法。其实MXNet提供了相应的转换工具帮助我们完成这一流程,本文记录一下这种方法。下载caff原创 2016-12-10 16:26:52 · 6617 阅读 · 2 评论 -
神经网络:AlexNet
《ImageNet Classification with Deep Convolutional Neural Networks》论文解读本文出自NIPS2012,作者是大神Alex Krizhevsky,属于多伦多大学Hinton组。概述本文提出的神经网络结构被成为AlexNet,在我最近的研究学习中发现,这一结构及其变种在很多任务中都有使用,回过头来重温一下这篇论文仍然是有必要的。归根到底,本文原创 2016-11-04 15:50:09 · 34283 阅读 · 0 评论 -
使用TensorFlow实现TCDCN
本文使用TensorFlow实现了TCDCN网络结构,关于TCDCN可以阅读我的另一篇博客[《Facial Landmark Detection by Deep Multi-task Learning》论文解读](http://blog.youkuaiyun.com/tinyzhao/article/details/52730553)。原创 2016-10-07 19:32:46 · 4096 阅读 · 6 评论 -
目标检测:Faster R-CNN
《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》论文解读本文来自Shaoqing Ren,看论文作者列表也是天团级配置,Kaiming He, Ross Girshick, and Jian Sun。概述前面的Fast R-CNN已经把特征提取、目标分类和边框回归统一到了一个框架下面,现在原创 2016-12-20 13:54:06 · 2195 阅读 · 0 评论 -
目标检测:Fast R-CNN
《Fast R-CNN》论文解读本文作者是Ross Girshick,和R-CNN作者一样。概述前面提到端到端的检测框架是很难实现的,那么先把除了region proposal的部分统一起来。Fast R-CNN贡献就在于把特征提取,SVM,Bounding box regression统一到一个框架里面了。Fast R-CNN先说点题外话,如何阅读一篇论文?对于深度学习方面的论文,我觉得要关注以下原创 2016-12-19 15:56:43 · 1849 阅读 · 0 评论 -
目标检测:SPP-net
《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》论文解读本文来自Kaiming He大神。上文说到R-CNN的最大瓶颈是2k个候选区域都要经过一次CNN,速度非常慢。Kaiming He大神最先对此作出改进,提出了SPP-net,最大的改进就是只需要将原图输入一次,就可以得到每个候选区域的特原创 2016-12-18 13:29:31 · 13005 阅读 · 0 评论 -
球谐函数与光照估计
最近用到球谐函数(Spherical Harmonics),这是一种非常优雅的光照模型。关于球谐函数,具体的数学推导可以在维基百科上查到: https://en.wikipedia.org/wiki/Spherical_harmonics我主要介绍一下球谐函数在光照估计中的应用。球谐函数光照估计就是从图片中获取光照信息,从而降低光照对纹理的影响。传统的光照估计依赖于光源方向和法线方向的估计,而原创 2017-03-16 13:56:00 · 9069 阅读 · 3 评论