
图像处理
文章平均质量分 71
xiao囡囡
偶是一枚菜鸟女码农
展开
-
Tesseract-OCR 字符识别-样书训练
原文出处:http://www.myexception.cn/mobile/1119147.html训练样本关于如何训练样本,Tesseract-OCR官网有详细的介绍http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3。这里通过一个简单的例子来介绍一下如何进行样本训练。1.下载工具jTessBox转载 2013-07-13 10:00:56 · 4246 阅读 · 1 评论 -
Centos下 ffmpeg 和opencv一起配合处理视频
默认安装的opencv 很多视频格式打不开,cvCreateFileCapture返回值为NULL,为了解决此问题,需要安装视频编解码的库,我选择安装ffmpeg,我在windows下也用过这个库。1、下载ffmpeg从svn上下载,需要先安装svnyum install subversionsvn checkout svn://svn.mplayerhq.hu//ffmpeg/t原创 2014-03-11 20:57:24 · 3456 阅读 · 0 评论 -
opencv 正脸和侧脸检测
算法参考三篇论文:最早的Haar特征由Papageorgiou C.等提出(《A general framework for object detection》),后来Paul Viola和Michal Jones提出利用积分图像法快速计算Haar特征的方法(《Rapid object detection using a boosted cascade of simple features原创 2013-10-31 15:34:55 · 16744 阅读 · 7 评论 -
OpenCV-图像几何变换:旋转,缩放,斜切 .
几何变换几何变换可以看成图像中物体(或像素)空间位置改变,或者说是像素的移动。几何运算需要空间变换和灰度级差值两个步骤的算法,像素通过变换映射到新的坐标位置,新的位置可能是在几个像素之间,即不一定为整数坐标。这时就需要灰度级差值将映射的新坐标匹配到输出像素之间。最简单的插值方法是最近邻插值,就是令输出像素的灰度值等于映射最近的位置像素,该方法可能会产生锯齿。这种方法也叫零阶插值转载 2013-11-20 10:39:58 · 1851 阅读 · 0 评论 -
Hough 检测直线
1、Hough变换H ough变换是一种快速的形状匹配技术。经典的H ough变换适用于曲线形状可以用参数来描述、而曲线位置未知情况下的曲线检测。如下:在笛卡儿坐标系中, 直线可以用斜截方程y = kx + b 表示。考虑同一直线上的两点( x i, yi ) 和( xj, yj ), 满足yi = kx i+ b 和yj = kxj + b, 映射到参数空间后的两条正弦曲线Q=x i c原创 2013-11-19 19:57:42 · 1721 阅读 · 0 评论 -
图像LBP特征
关于理论知识参考他人博客http://blog.youkuaiyun.com/zouxy09/article/details/7929531计算图像的每一小块的LBP直方图特征如下代码所示,下面代码提取出的特征向量为8维,如果要修改维数,修改下面标注的地方。如果要取得图像LBP特征的128维时,则可分为每一小块,对每一小块做下面操作即可,然后将每个小块的直方图联合成一个8×16的128维的向量即可。v原创 2013-10-29 20:50:58 · 1533 阅读 · 0 评论 -
Hog学习
转自:http://www.cnblogs.com/tornadomeet/archive/2012/08/15/2640754.html一、网上一些参考资料 在博客目标检测学习_1(用opencv自带hog实现行人检测) 中已经使用了opencv自带的函数detectMultiScale()实现了对行人的检测,当然了,该算法采用的是hog算法,那么hog算法是怎样实现的呢转载 2013-09-14 09:43:40 · 2245 阅读 · 0 评论 -
c++ DirectShow播放任意格式的视频
利用opencv只能处理.avi的视频,opencv之前的版本之前试过好像是只能处理.avi未压缩版本的视频,未压缩过的视频相当大,一个文件大概是几十个G。(这个不确定,因为之前用的压缩过的.avi的格式的cvCreateFileCapture时会出错)后来利用opencv的新版本可以处理H.264/mpeg4等压缩格式的.avi文件,但是还是不能处理像现在很广泛应用的flv等格式,当然可以用原创 2013-09-08 16:29:19 · 4495 阅读 · 0 评论 -
最新版ffmpeg 提取视频关键帧
对于ffmpeg的配置请看我的上篇博客:http://blog.youkuaiyun.com/kuaile123/article/details/11367309所用视频为 flv格式的 《爱在春天 TV版 47.flv》因为ffmpeg的函数和版本有关系,这里记录下我所用的整合的版本,是昨天下的最新版的,需要请下载http://download.youkuaiyun.com/detail/kuaile123原创 2013-09-08 15:04:09 · 7523 阅读 · 1 评论 -
CEDD(Color and Edge Directivity Descriptor)学习篇
cedd是一种综合颜色和纹理的特征提取方法。参考论文:FCTH: FUZZY COLOR AND TEXTURE HISTOGRAM :A LOW LEVEL FEATURE FOR ACCURATE IMAGE RETRIEVAL网上搜索的关于cedd的介绍很少,看得也很是纠结,还有一些细节方面没有弄很清楚,先写一下以后备用,慢慢细化。一、CEDD简介 将图像划分成若干原创 2013-08-12 16:44:38 · 2919 阅读 · 0 评论 -
计算灰度共生矩阵相关性时sigmax,y 为0的问题
在计算图像的灰度共生矩阵时,相关性值得到的经常为1.#IND、1.#INF 发现在计算sigmax和sigmay时经常算出来为0,所以发生了除零的问题,不知道这个除零如何解决。在http://www.cnblogs.com/skyseraph/archive/2011/08/27/2155776.html发现将sigma为零时将局部相关度赋值为8。不知道此处为何是8。这样就不会发生除零原创 2013-08-22 10:19:00 · 1290 阅读 · 1 评论 -
Tesseract使用日记
一、工具使用tesseract-ocr-setup-3.02.02.exe下载安装将tesseract-ocr-3.02.chi_sim.tar.gz(中文训练库)下载解压之后将chi_sim.traineddata文件拷贝到tesseract-安装目录的tessdata下面就可以进行中文的识别命令格式为:tesseract [-l lang] [configfile [[+原创 2013-07-11 18:00:24 · 4861 阅读 · 2 评论 -
关于tesseract 出错信息:read_params_file: Can't open chi_sim
很奇怪当键入命令:tesseract.exe 1.jpg result -1 chi_sim 会出错 识别出来是这个烂东西: 但是当我拷别人的命令时不会出错很是纳闷。观察发现这上下两图的1和l不一样,原来应该是L而不是1,language的意思。囧啊,现在识别就对了原创 2013-07-14 09:34:19 · 16781 阅读 · 10 评论 -
tesseract识别图片中文字(一)
一、对于背景复杂的文本 我测试用的简单的单行文本,如果非文本区多对二值化影响大,首先进行提取文本行,再对提取的文本行进行二值化。实例图片:图片中的文字区域从此视频帧中提取:1、切取图片中的行 提取边缘信息,边缘图像进行水平投影,将每一行中的像素值相加,得到一个每行边缘信息的数组,求数组的波谷,两个波谷直接的区间就为文本行。 求取波谷,原创 2013-07-12 20:15:12 · 3479 阅读 · 0 评论 -
Centos6.5 下安装opencv
为了熟悉一下linux下C++,准备通过将以前所写项目由windows移植到linux下,首先配置环境,这个还挺繁琐,出错挺多的,现在记录一下。系统:Centos 6.5最后版本 OpenCV: 2.4.3原创 2014-03-10 17:45:36 · 7592 阅读 · 0 评论