
AI and Image Processing
文章平均质量分 89
aipiano
在寻求内心平静且富足的路上
展开
-
OpenCV与Compressive Tracking实现人脸的实时检测与跟踪
最近一直在关注压缩传感方面的东西,正好看到一篇新论文《Real-Time Compressive Tracking》。作者将压缩感知与图像跟踪结合起来,实现了有效的降维,最后只用一个简单的朴素贝叶斯分类器就实现了非常鲁棒的跟踪效果,值得一提的是,这个算法的实时性非常好,在320×240的分辨率下能达到40fps左右的速度。具体论文和代码可以参看作者的网页http://www4.comp.polyu原创 2013-03-20 16:48:08 · 8510 阅读 · 0 评论 -
关于Batch Normalization的另一种理解
Batch Norm可谓深度学习中非常重要的技术,不仅可以使训练更深的网络变容易,加速收敛,还有一定正则化的效果,可以防止模型过拟合。在很多基于CNN的分类任务中,被大量使用。 但我最近在图像超分辨率和图像生成方面做了一些实践,发现在这类任务中,Batch Norm的表现并不好,加入了Batch Norm,反而使得训练速度缓慢,不稳定,甚至最后发散。原创 2017-01-11 16:00:04 · 10010 阅读 · 4 评论 -
Tensorflow实现照片风格的迁移
很多人都用过Prisma这个app,可以将普通照片转换为想要的风格。其背后的原理,就是通过神经网络学习某个图像的风格,然后再将这种风格应用到其他图像上。 这次通过tensorflow自己实现了一个这样的网络。原创 2017-01-10 15:51:24 · 22071 阅读 · 8 评论 -
Tensorflow实现二次元图片的超分辨率
github上有一个很有意思的项目,waifu2x,原理是通过一个训练好的CNN,将低分辨率的图像放大2倍或更多,同时保留足够的细节,使放大后的图像不会过于模糊或失真。该项目是用lua+Touch写的,最近在学习Tensorflow,闲暇之余打算在TF上自己实现一个这样的系统。原创 2016-12-17 15:56:26 · 22122 阅读 · 54 评论 -
Kinect深度图与RGB摄像头的标定与配准
自从有了Kinect,根据深度图提取前景就非常方便了。因此出现了很多虚拟现实、视频融合等应用。但是,Kinect自身的RGB摄像头分辨率有限,清晰度也不及一些专业摄像头,因此有了用第三方摄像头代替Kinect摄像头的想法。现在的问题是,如何将Kinect的深度图与第三方摄像头的RGB图像对准?我们知道,当使用Kinect的RGB时,有方便的MapColorCoordinatesToDepth(...原创 2013-07-07 23:24:48 · 64976 阅读 · 175 评论 -
OpenGL与OpenCV实现增强现实
很久没有写博客了,最近在学习计算机视觉的相关知识,于是写了一个AR的小Demo。该程序通过OpenCV实现对Marker的识别和定位,然后通过OpenGL将虚拟物体叠加到摄像头图像下,实现增强现实。原创 2014-11-29 18:47:48 · 21438 阅读 · 36 评论 -
引导滤波的OpenCV实现
引导滤波可以写出时间复杂度与窗口大小无关的算法,现在就来使用C++并借助OpenCV实现这一算法。实现这种算法的关键思想是盒式滤波(box filter),而且必须是通过积分图来实现的盒式滤波,否则不可能与窗口大小无关,好在OpenCV的boxFilter函数满足这个要求。原创 2014-03-13 12:13:55 · 10639 阅读 · 20 评论 -
双边滤波与引导滤波
简单说明了双边滤波和引导滤波的原理,并比较了他们的异同点。原创 2014-03-07 17:04:52 · 21705 阅读 · 7 评论 -
学习Machine Leaning In Action(二):kNN
kNN算法又称为k最近邻算法,是各种分类算法中较简单的一种(有可能是最简单的)。他的思路很好理解,即将待分类向量和所有已知向量求距离,再统计k个最小距离向量所属的类型,最多的类型即为待分类向量的类型。虽然简单,但它的效果却原创 2013-07-19 11:52:21 · 2389 阅读 · 0 评论 -
稀疏表征与物体识别
物体识别一直是机器视觉与人工智能方面的研究热门,其方法更是多彩多样。有没有一种能够在线学习,且学习或特征提取速度快,同时鲁棒性好的方法呢?答案是肯定的,而且方法还不止一种。最近实现了一个基于稀疏表征(Sparse Representation)的物体分类算法,可以称作字典学习(Dictionary Learning),就能达到上述目的。不过这里说是字典学习有些牵强,毕竟并没有真正学习字典(MOD或原创 2013-03-24 21:42:34 · 4562 阅读 · 0 评论 -
学习Machine Leaning In Action(三):朴素贝叶斯
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础。朴素贝叶斯分类就是其中一种,之所以称为朴素, 是因为其思想很简单,且建立在两个看似鲁莽的假设之上。朴素贝叶斯认为,概率最大的那个类,就是待分类对象的所属类,且假设(1)所有特征属性统计独立;(2)所有特征属性同等重要,权重相同。这两个看似鲁莽的假设,在很多实际应用中却有很好的效果,因此朴素贝叶斯分类器任然被广泛使用。一、理论原创 2013-07-19 15:02:37 · 2672 阅读 · 0 评论 -
学习Machine Leaning In Action(四):逻辑回归
作为“学习Machine Learning In Action”系列的第四篇,讨论了逻辑回归分类方法的原理,并对书中没有解释清楚的地方进行了补充,同时提供了C#版本的算法实现。原创 2013-07-19 21:20:38 · 5759 阅读 · 2 评论 -
学习Machine Leaning In Action(一):准备
现在开始看《Machine Learning In Action》,英文原版,一本比较注重工程实践的书,对于不想啃复杂数学公式的人来说,很有吸引力!霍啦,就是这一本了:同时,这本书使用的语言是Python,并不是打广告,Python用来Idea验证与快速测试,真是再适合不过了!不过我是C++爱好者,如果有一些很有用的算法,我还是会用C++再写一遍的,也方便以后的使用。第一部分先把环原创 2013-06-15 20:16:09 · 2527 阅读 · 0 评论 -
稀疏编码中的正交匹配追踪(OMP)与代码
最近在看有关匹配追踪与相关优化的文章,发现了这篇http://blog.youkuaiyun.com/scucj/article/details/7467955,感觉作者写得很不错,这里也再写写自己的理解。文中有Matlab的代码,为了方便以后的使用,我顺便写了一个C++版本的,方便与OpenCV配合。为了方便理解,我将所有向量都表示为平面二维向量,待用原子表征的目标向量y,用红色表示,原子向量用原创 2013-04-19 19:42:11 · 5842 阅读 · 14 评论 -
机械臂与相机的标定
文章目录简介In-Hand CameraFixed Camera非线性优化References简介 机械臂在运动时,往往需要配合视觉信息进行目标的定位或识别,这就涉及到如何将相机坐标系(Camera Frame)下的物体转换到机械臂自身的坐标系下(Base Frame)。这一问题一般通过手眼标定(Hand-Eye Calibration)解决,其中的“手”即为机械臂,“眼”即为相机。 具...原创 2019-09-05 11:39:41 · 12102 阅读 · 10 评论