
Video Coding & Image Pro
文章平均质量分 74
Snail_Walker
Google Senior Machine Learning Tech Lead | 行胜于言
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数字图像处理之数字图像基础
视觉成像原理请参考Atchison,D.A and Smith.G[2000].Optics of the Human Eye,Butterworth-Heinemann,Boton,Mass。电磁波方面的原理请参考Born,M. and Wolf,E.[1999].Principle of Optics:Electromagnetic Theory of Propagation,Interfac原创 2014-06-30 00:29:10 · 1540 阅读 · 0 评论 -
数字图象处理之二维码图像提取算法(九)
经过对二维条码的预处理过程,去除了条码中包含的大部分背景信息,初步定定位了QR条码,实现了对二维条码的滤波和二值化处理。但是要提取QR码中的码字信息,还需要经过下面三个步骤:(1) 利用QR码符号特有的三个位置探测图像,快速完成对QR码的精确定位,确定条码的倾斜角度,完成旋转。(2) 计算QR码四个顶点坐标,作为条码图像几何畸变校正的四个控制点,完成QR条码的几何畸变校正。(3转载 2014-12-12 00:18:06 · 18697 阅读 · 6 评论 -
错误隐藏学习手记(七)
方法论 要用硬件实现。虽然整个大的框架我们已经搞定了,但是这算是一个比较大的工程,所以这里我们采用的设计方法其实是Meet-in-the-Middle的方法进行设计,所以我先实现帧内错误隐藏,先对一幅图片进行插值。那么我们需要先显示一幅图片,在这里介绍两个软件给大家。Image2LCD和BmpToMif。Image2LcdImage2Lcd 是一款工具软原创 2015-02-05 12:29:08 · 1264 阅读 · 0 评论 -
错误隐藏学习手记(八)
在算法层次,我们差不多搞懂了错误隐藏是什么东西,整个流程也搞懂了。但是接下来我们要看看我们的实现平台,我们要对此十分了解。这一次我们实现这个算法是使用硬件实现的,采用xilinx的zedboard来实现。所以呢,我们需要对整个平台十分了解,之后才好利用里面的资源。ZedBoard有两部分:PL和PS。他的资源大概包括: 内存:512MB DDR3 (128M*32)资源很丰原创 2015-02-06 20:47:29 · 1362 阅读 · 0 评论 -
数字图象处理之二维码图像提取算法(十二)
新年代码大放送:// test1.cpp : Defines the entry point for the console application.#include "stdafx.h"#include "highgui.h"#include "cv.h"#include "cvaux.h"#include "stdio.h"#pragma comment(lib, "ml.l原创 2015-02-22 00:27:11 · 8781 阅读 · 9 评论 -
不看任何数学公式,都可完全理解傅里叶分析
傅里叶分析不仅仅是一个数学工具,更是一种可以彻底颠覆一个人以前世界观的思维模式。但不幸的是,傅里叶分析的公式看起来太复杂了,所以很多大一新生上来就懵圈并从此对它深恶痛绝。老实说,这么有意思的东西居然成了大学里的杀手课程,不得不归咎于编教材的人实在是太严肃了。(您把教材写得好玩一点会死吗?会死吗?)所以我一直想写一个有意思的文章来解释傅里叶分析,有可能的话高中生都能看懂的那种。所以,不管读到这里的您转载 2015-02-12 02:56:03 · 1677 阅读 · 4 评论 -
视频编解码之H.264快速入门
视频编解码快速学习入门视频编解码快速学习入门架构编码解码帧内宏块预测初认识4X4亮度块预测模式16X16亮度块预测模式8X8色度块预测模式帧内预测模式编码P片帧间预测初认识树结构的运动补偿次像素运动矢量运动矢量预测变换和量化初认识4X4残差变换和量化块0-1518-25从4X4 DCT推出的整数变换量化改变标度逆量化4X4亮度DC系数变换和量化只在16X16转载 2015-04-22 18:04:43 · 7654 阅读 · 1 评论 -
视频编解码之学之前你得知道的事情
人类视觉系统结构处理颜色模型RGBHSICMYYUV计算机视觉系统采集信息处理图像的数字化视频压缩编码图像预处理成像数字视频基本概念各种标准H261MPEG-1标准MPEG-2H262标准H263MPEG-4标准H264标准H265标准视频标准测试人类视觉系统结构人的视觉系统可以说是精妙。人眼工作时,物体反射的光线通过眼角膜,折射入前房,最后在水晶透原创 2015-04-24 20:56:16 · 2159 阅读 · 0 评论 -
视频编解码之基本原理
意义分类基于图像统计特性的视频编码方法预测编码帧内预测帧间预测变换编码傅里叶变换哈达玛变换K-L变换离散余弦变换DCT小波变换量化编码熵编码子带小波编码基于内容的视频编码方法意义做一件事情我们总是喜欢问做这一件事情有没有意义啊?如果没有意义,为什么我要做呢?人有时候就是这么有想法的动物。我们说我们在做视频编解码,那么为什么要做呢?其实一方面是因为照现有视频标准来传输数据原创 2015-04-25 17:52:46 · 5564 阅读 · 3 评论 -
OpenCV之摄像头捕捉图像
代码运行效果代码之前我找过directshow,CameraDS,VedioCaptureFromCam之类的东西,发现都不可以用。directshow是因为版本太老了,会出现: http://www.opencv.org.cn/forum.php?mod=viewthread&action=printable&tid=33813 VedioCaptureFromCam就会显示不出图片。所以后原创 2015-06-23 09:16:13 · 5917 阅读 · 0 评论 -
数字图像处理之配置opencv中遇到的问题
现在网络上有很多的教程,上面有配置opnecv的教程有很多,综合其中的优点便可以配置成功!~参考教程:配置系统变量:http://wenku.baidu.com/link?url=8J6XO19h3dncpZRXgAY-JBmpsgVsNtZEsyRphe2rIEOVVH8hEwuFx1t-7U42TtH8ycVIPvmzHmAqycz53Lxi3HpTZHyYPBhfMNAb原创 2014-12-15 21:39:27 · 929 阅读 · 0 评论 -
Algorithm Accumulation
目标检测DPMHOGSIFT最优匹配DTWHMM多目标优化ILP这篇博客就用来积累学过的一些比较好的算法,现开始觉得算法真是一个宝啊!目标检测DPM参考博客 英文文档HOG参考博客 参考文章SIFT参考博客最优匹配DTW参考博客HMM参考博客多目标优化ILP参考博客,请点这里 待续。。。原创 2015-04-26 10:17:42 · 1060 阅读 · 0 评论 -
Video Coding Exit_Picture
recfr.p_Vid = p_Vid;VideoParameters *p_Vid1 = recfr.p_Vid;StorablePicture* refPic = p_Vid1->ppSliceList[0]->listX[0][0];//p_Vid->ppSliceList[0]->listX[0][0];if(p_Vid->dec_picture->frame_num == 8){原创 2015-11-23 17:04:19 · 720 阅读 · 0 评论 -
CV的顶会和杂志
ICCV的全称是International Comference on Computer Vision,正如很多和他一样的名字的会议一行,这样最朴实的名字的会议,通常也是这方面最nb的会议。ICCV两年一次,与ECCV正好错开,是公认的三个会议中级别最高的。它的举办地方会在世界各地选,上次是在北京,下次在巴西,2009在日本。iccv上的文章看起来一般都比较好懂,我是比较喜欢的。CVPR的全称是In转载 2015-12-08 13:57:10 · 7607 阅读 · 0 评论 -
数字图象处理之二维码图像提取算法(六)
整体的框图如下所示:Hough 变换是图像空间和参数空间之间的一种变换, 利用点与线的对偶性,将原始图像空间的给定曲线变为参数空间的一个点,这样直线的检测就变为参数空间中峰值的检测。接下来来了解一下霍夫变换: 可以证明,直角坐标系p-0中的一条直线和极坐标上的点是一一对应的,而且直角坐标系中同一条直线上的点对于极坐标p-0上的曲线必定会有一个公共交点。那么就可转载 2014-12-11 21:56:53 · 4572 阅读 · 0 评论 -
数字图象处理之二维码图像提取算法(五)
在预处理之后,接下来就要进行码字提取。在码字提取部分,我们采用的就是霍夫(Hough transform)变换。通过霍夫变换我们可以知道整个二维码倾斜的角度,然后我们就可以进行二维码的矫正。 霍夫变换具体如下:采用分级的Hough变换方法,不但降低了Hough变换的运算量,而且精确的求得了条码的倾斜角度。其次,扫描 PDF417条码的起始和终止符确定条码的左右边界线方程,结合H转载 2014-12-11 08:22:47 · 5974 阅读 · 0 评论 -
数字图象处理之二维码图像提取算法(七)
二维条码图像提取主要是实现二维条码中码字的提取,包括图像预处理和码字提取两部分。具体的流程图如下所示: 整个图像提取流程大致分为 8 个步骤, 现按步骤分别说明如下: 第一步 将图像采集设备获取的彩色条码图像进行灰度化处理,降低数据量,减少存储空间和图像处理时间。 第二步 使用中值滤波去除采集二维条码图像时引入的噪声点,降低噪声对后转载 2014-12-11 22:02:46 · 5730 阅读 · 0 评论 -
数字图象处理之浅谈数字图像处理
从今天开始,小哥就和大家一起学习数字图象处理吧!这里我更多是说原理这一层,要是大家想动手实践的话,有兴趣就去看看《学习opencv》,里面都是真刀真枪的操作!首先,我们要明白什么是数字图像处理。数字图象处理就是应用计算机对数字化的图片进行处理,数字化的图片就是由离散的每个点组成,每个点都有灰度值。当然,对于数字图象处理也可以理解为包括两个方面:一是输入与输出均是图像的处理;二是可以从图像中原创 2014-06-30 00:30:51 · 2044 阅读 · 0 评论 -
数字图像处理之二维码图像提取算法(二)
二维码标准:国外:pdf417,Datamatrix,QR国内:龙贝,汉信。 图像输入-> 图像预处理-> 二维码图像切割(定位)-> 二维码图像校正-> 译码译码:二维码码字提取-> 纠错译码-> 信息译码纠错译码:求解伴随因子(判断) 正确码字=Yji ^ 错误码字。;信息译码:模式指示+字符段+数据位流 判断编码模式和字转载 2014-11-06 13:27:59 · 35804 阅读 · 4 评论 -
数字图像处理之二维码图像提取算法(三)
二维码预处理之自适应亮度均衡算法的介绍转载 2014-11-06 15:02:43 · 6817 阅读 · 4 评论 -
数字图像处理之二维码图像提取算法(一)
二维条码从类别上分为两大类,一类是以PDF417为代表的堆叠式二维条码,还包括CODE49、CODE 16K等,其原理都是建立在一维条码的基础上。另一类是以QR码为代表的矩阵式二维条码,包括Data Matrix、Maxi Code、Code One等,是一些比较转载 2014-11-06 10:04:15 · 17283 阅读 · 1 评论 -
数字图像处理之二维码图像提取算法(十一)
// check ratio requirement b:w:b:w:b = 1:1:3:1:1bool qr_checkRatio(){ totalFinderSize = 0; for(int i =0;i<5; i++) { int count = stateCount[i]; totalFinderSize +=原创 2014-12-20 10:15:44 · 6075 阅读 · 4 评论 -
数字图像处理之二维码图像提取算法(十)
这里来说明一下做这次的二维码提取算法用到的函数,最后再给出完整的代码! 进行图像的二值化,这里可以使用opencv2里的函数threshold,当然在opencv里也有cvThreshold函数 (这个函数可以具体参考:http://blog.youkuaiyun.com/xuehuic/article/details/7401181)首先我们要了解:最原创 2014-12-19 22:38:09 · 8593 阅读 · 0 评论 -
错误隐藏学习手记(一)
差错控制技术主要是在编码端通过改变策略或添加冗余的方式,将错误限制在一定的范围之内防止误码扩散。使用该法当然是一定程度上保证了视频质量,却增加了带宽。网络流量很可能不够,速度会比较慢。相比之下,错误隐藏是一种在解码端进行处理的技术。错误隐藏就是解码器在不需要从编码器得到额外信息的前提下,利用当前帧已接收宏块或先前已接收视频序列的相关性对丢失宏块进行恢复,以主观可接受的近似原来质量的视频数据来隐藏错原创 2015-02-01 11:14:33 · 3115 阅读 · 0 评论 -
错误隐藏学习手记(二)
错误隐藏技术是在H.264在解码端后端的一种技术,用于恢复某一丢失帧或者宏块。一般来说每个宏块是16*16。 Step1:我们怎么知道是哪一块宏块丢失了呢? 这就和视频编解码H.264有些关系了。JM86中丢失块的确定取决于编码端灵活宏块重排模式(FMO)。FMO将一幅图像中的宏块进行重排,重排后映射到不同的片组中,以片为单位进行传送。解码端检测片是否丢失,如果丢失则根据原创 2015-02-02 22:56:15 · 1366 阅读 · 0 评论 -
错误隐藏学习手记(三)
帧内错误隐藏算法集合:1、空间加权像素平均算法(加权像素平均插值算法)P0就是丢失的宏块,灰色的是最近的像素点。2、方向插值:(1)边缘检测及梯度计算: 使用Sobel算子,计算的是Sx和Sy(水平边缘和垂直边缘)下图中,a,b,c,d是缺失的宏块,灰色的是参考像素。 Sobel算子如下,这是用来进行边原创 2015-02-03 01:41:12 · 1141 阅读 · 0 评论 -
错误隐藏学习手记(五)
在H.264的研究中,我们可以看到目前有三种开源编码,很多测试都是在一个开源编码中实现的,这个开源编码就叫做:JM86。在这里呢具体介绍一下这三种开源编码:一、三大开源编码器介绍1、JMH.264的官方测试源码,由德国hhi研究所负责开发。特点:实现了264所有的特性,由于是官方的测试源码,所以学术研究的算法都是在JM基础上实现并和JM进行比较。但其程序结构冗长,只考虑引入各种原创 2015-02-03 09:42:27 · 997 阅读 · 0 评论 -
数字图象处理之二维码图像提取算法(四)
拍摄印制在物品上的二维条码图像时, 除二维条码图案外,通常还会包含其他的背景信息,二维条码只占据整个图像的一部分。提出了一种条码的初步定位算法,能够迅速的定位二维条码的大致范围,并将其切割出来,去掉大部分无用的背景信息,既能够减少干扰,提高识别率,又能够减少后续图像处理的时间,提高译码速度。 相较于其他的图形,二维条码拥有非常丰富边缘信息,利用这个特性可以实现对二维条码的初步定位。步转载 2014-12-11 08:06:32 · 15895 阅读 · 3 评论 -
错误隐藏学习手记(四)
帧间错误隐藏算法整理:1、零矢量拷贝错误隐藏算法:当图像帧某一宏块丢失之后,直接拷贝当前帧的前一帧的相同位置的宏块过去。当然,这种算法对于非激烈运动的视频还是可以的。算法简单,复杂度低,实时性比较好。缺点就是对于局部剧烈运动或者剧烈运动的视频会有很大的误差,严重影响观赏效果。2、边界匹配错误隐藏算法(BMA,boarder match algorithm):利用丢失宏块与其周围宏块的相关性原创 2015-02-03 09:05:01 · 1451 阅读 · 0 评论 -
错误隐藏学习手记(六)
现在又出了H.265,我觉得有必要在错误隐藏方面也要跟进,采用和H.265标准一致的东西才好! 那么H.264和H.265的区别在于哪里呢? 随着用户对监控视频质量的要求越来越高,高清视频在安防监控中的应用越来越普及,由此带来了存储空间和成本的急剧上升。与现在正在使用的H.264编码技术相比,H.265的高压缩率特性能够节省一半左右的存储空间,从而显著转载 2015-02-03 10:17:57 · 1090 阅读 · 0 评论 -
数字图象处理之二维码图像提取算法(八)
PDF417码几何失真的校正:(1)每个 PDF417 条码都包含一个起始符和终止符,且其模块比例是固定的。 利用这个特性,可以采取扫描条码左右边缘点,能后采用直线拟合方法来确定条码的左右边缘直线。Hough 变换中获得的条码横向边界直线,可以得到四个交点,这四个交点就是 PDF417 条码的四个顶点,将其作为几何畸变校正的四个控制点。具体步骤如下:1) 从 PDF417转载 2014-12-11 22:18:33 · 4897 阅读 · 0 评论 -
IMAGE REGISTRATION
Classification Nature: area-based and feature-based.Different viewpoints (multiview analysis): image from different viewpoints, 2D or 3D representation like remote sensing and stereo vision.Differen原创 2016-01-29 17:15:00 · 1281 阅读 · 0 评论