
机器视觉
文章平均质量分 73
pragma_g
这个作者很懒,什么都没留下…
展开
-
关于halcon WPF窗口显示对象过多时缩放黑屏的问题解决办法
halcon WPF窗口显示对象过多时缩放黑屏的真正原因原创 2022-11-03 21:14:18 · 753 阅读 · 0 评论 -
C++ 出现异常“.... \debug_heap.cpp Line:980 Expression:__acrt_first_block==header"
我的运行环境为VS2017+Opencv4.0.0beta findNonZero函数出现的调用异常问题如下: 错误:File: minkernel\crts\ucrt\src\appcrt\heap\debug_heap.cpp Line: 980 Expression: __acrt_first_block == header For information on how your...转载 2018-11-25 18:50:49 · 2454 阅读 · 1 评论 -
行人检测SVM样本训练详解(附代码)
在2005年CVPR上,来自法国的研究人员Navneet Dalal 和Bill Triggs提出利用Hog进行特征提取,利用线性SVM作为分类器,从而实现行人检测。而这两位也通过大量的测试发现,Hog+SVM是速度和效果综合平衡性能较好的一种行人检测方法。后来,虽然很多研究人员也提出了很多改进的行人检测算法,但基本都以该算法为基础框架。因此,Hog+SVM也成为一个里程表式的算法被写入到Ope...转载 2018-10-13 10:28:08 · 3216 阅读 · 0 评论 -
numpy.r_与numpy.c_理解
numpy.r_和numpy.c_都是用来对多个片段进行连接,组成一个数组Translates slice objects to concatenation 两者连接的方式稍有差异,r_表示将片段沿着第一维度方向进行级联;c_表示将片段沿着第二维度方向进行级联。比如例1:两个列表 list1 = [1, 2, 3] list2 = [4, 5, 6],各自维度元组均为(3,)(3列),元组第一...原创 2018-06-12 15:39:05 · 1338 阅读 · 0 评论 -
window系统PaddlePaddle环境的搭建
转自https://blog.youkuaiyun.com/lizh_2018/article/details/79199539原帖中间有点小问题大家都知道,pip工具只有在Linux系统下可以直接完成PaddlePaddle的安装,而且要进行一系列的环境配置才能够使用。那么如果是在Windows系统下想要使用Paddlepaddle该怎么办呢,本文就Windows10家庭版为例,讲述一下如何进行Paddle...转载 2018-06-04 15:39:16 · 5498 阅读 · 1 评论 -
关于win7中VS2013配置opencv2.4.13 时报CPACK_PACKAGE_VERSION错
在win7中配置opencv2.4.13 时报错 ,错误信息是:CMake Warning at cmake/OpenCVPackaging.cmake:23 (message): CPACK_PACKAGE_VERSION does not match version provided by version.hpp根据报错信息“”cmake/OpenCVPackaging.cmake:23“”...原创 2018-03-14 12:51:32 · 1760 阅读 · 1 评论 -
从波的角度理解图像处理的本质
图像其实是一种波,可以用波的算法处理图像。一、为什么图像是波?我们知道,图像由像素组成。下图是一张 400 x 400 的图片,一共包含了 16 万个像素点。每个像素的颜色,可以用红、绿、蓝、透明度四个值描述,大小范围都是0 ~ 255,比如黑色是[0, 0, 0, 255],白色是[255, 255, 255, 255]。通过 Canvas API 就可以拿到这些值。如果把每一行所有像素(上例是...转载 2018-02-23 11:50:32 · 3070 阅读 · 1 评论 -
神经网络
人工智能的底层模型是"神经网络"(neural network)。许多复杂的应用(比如模式识别、自动控制)和高级模型(比如深度学习)都基于它。学习人工智能,一定是从它开始。什么是神经网络呢?网上似乎缺乏通俗的解释。前两天,我读到 Michael Nielsen 的开源教材《神经网络与深度学习》(Neural Networks and Deep Learning),意外发现里面的解释非常好懂。下面,...转载 2018-02-23 11:53:11 · 372 阅读 · 0 评论 -
SVM:从理论到OpenCV实践
(转载请注明出处:http://blog.youkuaiyun.com/zhazhiqiang/ 未经允许请勿用于商业用途) 一、理论参考网友的博客:(1)【理论】支持向量机1: Maximum Margin Classifier —— 支持向量机简介(2)【理论】支持向量机2: Support Vector —— 介绍支持向量机目标函数的 dual 优化推导,并得出“支持向量”的概念(3)【理论】支持向量机...转载 2018-02-28 17:44:03 · 448 阅读 · 0 评论 -
HOG特征(Histogram of Gradient)学习总结
参考资料: HOG的经典论文:Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]//Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005, 1:...转载 2018-02-28 17:41:00 · 719 阅读 · 0 评论 -
OCR技术浅探一:特征提取
研究背景关于光学字符识别(Optical Character Recognition, 下面都简称OCR),是指将图像上的文字转化为计算机可编辑的文字内容,众多的研究人员对相关的技术研究已久,也有不少成熟的OCR技术和产品产生,比如汉王OCR、ABBYY FineReader、Tesseract OCR等. 值得一提的是,ABBYY FineReader不仅正确率高(包括对中文的识别),而且还能保...转载 2018-02-17 09:38:44 · 3016 阅读 · 0 评论 -
OpenCV3.4.0+contrib在VS2017下编译_win10 64位
一、前言 opencv新出了3.4.0版本,最近重装系统,索性就把VS和opencv全换成最新版了,索然不知道新添了啥牛逼功能,不过先把环境配置好再说。二、操作环境系统:win10 64位 其它:VS2017 CMake 3.10.0-rc3 vs2017和CMake的安装就不说了,网上还是有很多教程的,百度一下都好使。三、准备文件OpenCV3.4.0 ...转载 2018-01-26 22:58:17 · 4676 阅读 · 2 评论 -
图像卷积与滤波
一、线性滤波与卷积的基本概念线性滤波可以说是图像处理最基本的方法,它可以允许我们对图像进行处理,产生很多不同的效果。做法很简单。首先,我们有一个二维的滤波器矩阵(有个高大上的名字叫卷积核)和一个要处理的二维图像。然后,对于图像的每一个像素点,计算它的邻域像素和滤波器矩阵的对应元素的乘积,然后加起来,作为该像素位置的值。这样就完成了滤波过程。对图像和滤波矩阵进行逐个元素相乘再求和的操作就相当于将一个...转载 2018-02-17 09:49:13 · 302 阅读 · 0 评论 -
OCR技术浅探四: 语言模型和综合评估
语言模型由于图像质量等原因,性能再好的识别模型,都会有识别错误的可能性,为了减少识别错误率,可以将识别问题跟统计语言模型结合起来,通过动态规划的方法给出最优的识别结果。这是改进OCR识别效果的重要方法之一。 转移概率在我们分析实验结果的过程中,有出现这一案例。由于图像不清晰等可能的原因,导致“电视”一词被识别为“电柳”,仅用图像模型是不能很好地解决这个问题的,因为从图像模型来看,识别为“电柳”是最...转载 2018-02-17 09:44:21 · 1680 阅读 · 0 评论 -
OCR技术浅探三: 光学识别
经过前面的文字定位和文本切割,我们已经能够找出图像中单个文字的区域,接下来可以建立相应的模型对单字进行识别。 模型选择在模型方面,我们选择了深度学习中的卷积神经网络模型,通过多层卷积神经网络,构建了单字的识别模型。 卷积神经网络是人工神经网络的一种,已成为当前图像识别领域的主流模型。 它通过局部感知野和权值共享方法,降低了网络模型的复杂度,减少了权值的数量,在网络结构上更类似于生物神经网络,这也预...转载 2018-02-17 09:41:51 · 2272 阅读 · 0 评论 -
OCR技术浅探二: 文字定位和文本切割
文字定位经过前面的特征提取,我们已经较好地提取了图像的文本特征,下面进行文字定位。 主要过程分两步:1、邻近搜索,目的是圈出单行文字;2、文本切割,目的是将单行文本切割为单字。 邻近搜索我们可以对提取的特征图进行连通区域搜索,得到的每个连通区域视为一个汉字。 这对于大多数汉字来说是适用,但是对于一些比较简单的汉字却不适用,比如“小”、“旦”、“八”、“元” 这些字,由于不具有连通性,所以就被分拆开...转载 2018-02-17 09:40:19 · 8622 阅读 · 0 评论 -
tesseract 4.0在windows10 MSVC 15 2017下编译
第一步,准备工作包括安装Git,CMake以及下载cppan命令工具、从git上获取tesseract源码第二步,生成MSVC解决方案本文为64位编译器(32直接cmake ..即可),编译完成后,在build目录下出现tesseract.sln,即解决方案文件VS2017为15 2017第三步,MSVC中编译源码对解决方案执行生成解决方案过程中,会遇到以下问题1、C2001、C2059、C105...原创 2018-02-06 20:01:41 · 2589 阅读 · 6 评论 -
图形图像处理库大全
Google三维API O3D O3D 是一个开源的 Web API 用来在浏览器上创建界面丰富的交互式的 3D 应用程序。这是一种基于网页的可控3D标准。此格式期望真正的基于浏览器,独立于操作系统之外,并且支持主流的3D显卡,这样就可以在网页中实现效果逼真的3D动画。在线演示:http://o3... 更多O3D信息 最新新闻: 谷歌联手Mozilla基金开发3D互联网图转载 2018-02-06 12:53:01 · 1703 阅读 · 0 评论