OpenCV 3.x版本改进
摘要: OpenCV3是OpenCV计算机视觉库的最新版本,在架构和接口上都有不少的调整,对计算指令集也做了更多的优化,对OpenCL支持更好,性能有更大的提升。
OpenCV 3 的改动在哪?
C 风格的API很快将会消失,完全被C++的API替代,代码更加简洁、不易出错。读者如果想借助opencv最新的功能,记得清理代码中的C风格API。
C++ API 将更加简洁。
所有的算法都将继承自 cv::Algorithm 接口。
大型的模块将拆分为小模块,模块将在后面继续讲解。
作者:Vinjn张静
链接:https://zhuanlan.zhihu.com/p/19988205
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
OpenCV 3 有这么多文件夹,从何入手?
3rdparty/,包含第三方的库,比如视频解码用的 ffmpeg,jpg、png、tiff等图片的开源解码库。
apps/,包含进行 haar 分类器训练的工具,opencv 进行人脸检测便是基于 haar 分类器。如果你想检测人脸以外的图片,千万不要错过这几个工具。
cmake/,包含生成工程项目时 cmake 的依赖文件,用于智能搜索第三方库,普通开发者不需要关心这个文件夹的内容。
data/,包含 opencv 库以及范例中用到的资源文件,haar 物体检测的分类器位于haarcascades子文件中。
doc/,包含生成文档所需的源文件以及辅助脚本。
include/,包含入口头文件。opencv 子文件夹中是 C 语言风格的API,也就是《Learning OpenCV (第一版)》中描述的API函数,官方将逐渐淘汰 C 风格函数,因此我不推荐大家使用该文件夹中的头文件。opencv2 子文件中只有一个 opencv.hpp 文件,这是 cv2 以及 cv3 推荐使用的头文件。
modules/,包含核心代码,opencv 真正的代码都在这个文件夹中。opencv 从2.0开始以模块的方式组织各种功能,近两年模块的数量增长得很快,后面我会依次介绍每个模块的作用。
platforms/,包含交叉编译所需的工具链以及额外的代码,交叉编译指的是在一个操作系统中编译供另一个系统使用的文件。
samples/,这是大家最喜欢的范例文件夹了,将在之后的文章中介绍。
我没有 N 卡,该看哪些模块?
androidcamera/,仅用于android平台,使得可以通过与其他平台相同的接口来控制android设备的相机。
core/,核心功能模块,定义了基本的数据结构,包括最重要的 Mat 类、XML 读写、opengl三维渲染等。
imgproc/,全称为 image processing,即图像处理。包括图像滤波、集合图像变换、直方图计算、形状描述子等。图像处理是计算机视觉的重要工具。
imgcodec/,负责各种格式的图片的读写,这个模块是从以前的 highgui 中剥离的。
highgui/,高级图形界面及与 QT 框架的整合。
video/,视频分析模块。包括背景提取、光流跟踪、卡尔曼滤波等,做视频监控的读者会经常使用这个模块。
videoio/,负责视频文件的读写,也包括摄像头、Kinect 等的输入。
calib3d/,相机标定以及三维重建。相机标定用于去除相机自身缺陷导致的画面形变,还原真实的场景,确保计算的准确性。三维重建通常用在双目视觉(立体视觉),即两个标定后的摄像头观察同一个场景,通过计算两幅画面中的相关性来估算像素的深度。
features2d/,包含 2D 特征值检测的框架。包含各种特征值检测器及描述子,例如 FAST、MSER、OBRB、BRISK等。各类特征值拥有统一的算法接口,因此在不影响程序逻辑的情况下可以进行替换。
objdetect/,物体检测模块。包括haar分类器、SVM检测器及文字检测。
ml/,全称为 Machine Learning,即机器学习。包括统计模型、K最近邻、支持向量机、决策树、神经网络等经典的机器学习算法。
flann/,用于在多维空间内聚类及搜索的近似算法,做图像检索的读者对它不会陌生。
photo/,计算摄影学。包括图像修补、去噪、HDR成像、非真实感渲染等。如果读者想实现Photoshop的高级功能,那么这个模块必不可少。
stitching/,图像拼接,可用于制作全景图。
nonfree/,受专利保护的算法。包含SIFT和SURF,从功能上来说这两个算法属于features2d模块的,但由于它们都是受专利保护的,想在项目中可能需要专利方的许可。
shape/,形状匹配算法模块。用于描述形状、比较形状。
softcascade/,另一种物体检测算法,Soft Cascade 分类器。包含检测模块和训练模块。
superres/,全称为 Super Resolution,用于增强图像的分辨率。
videostab/,全称为 Video Stabilization,用于解决相机移动时拍摄的视频不够稳定的问题。
viz/,三维可视化模块。可以认为这个模块实现了一个简单的三维可视化引擎,有各种UI控件和键盘、鼠标交互方式。底层实现基于 VTK 这个第三方库。
我爱 CUDA,买了一堆 Tesla 加速卡,该看哪些模块?
这些模块的名称都以 cuda 为开始,cuda 是显卡制造商 NVIDIA 推出的通用计算语言,在cv3中有大量的模块已经被移植到了 cuda 语言。让我们依次看一下:
cuda/,CUDA-加速的计算机视觉算法,包括数据结构 cuda::GpuMat、 基于cuda的相机标定及三维重建等。
cudaarithm/,CUDA-加速的矩阵运算模块。
cudabgsegm/,CUDA-加速的背景分割模块,通常用于视频监控。
cudacodec/,CUDA-加速的视频编码与解码。
cudafeatures2d/,CUDA-加速的特征检测与描述模块,与features2d/模块功能类似。
cudafilters/,CUDA-加速的图像滤波。
cudaimgproc/,CUDA-加速的图像处理算法,包含直方图计算、霍夫变换等。
cudaoptflow/,CUDA-加速的光流检测算法。
cudastereo/,CUDA-加速的立体视觉匹配算法。
cudawarping/,实现了 CUDA-加速的快速图像变换,包括透视变换、旋转、改变尺寸等。
cudaev/,实现 CUDA 版本的核心功能,类似 core/ 模块中的基础算法。
作者:Vinjn张静
链接:https://zhuanlan.zhihu.com/p/19988205
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
快捷键
- 加粗
Ctrl + B
- 斜体
Ctrl + I
- 引用
Ctrl + Q
- 插入链接
Ctrl + L
- 插入代码
Ctrl + K
- 插入图片
Ctrl + G
- 提升标题
Ctrl + H
- 有序列表
Ctrl + O
- 无序列表
Ctrl + U
- 横线
Ctrl + R
- 撤销
Ctrl + Z
- 重做
Ctrl + Y
Markdown及扩展
Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的HTML页面。 —— [ 维基百科 ]
使用简单的符号标识不同的标题,将某些文字标记为粗体或者斜体,创建一个链接等,详细语法参考帮助?。
本编辑器支持 Markdown Extra , 扩展了很多好用的功能。具体请参考Github.
表格
Markdown Extra 表格语法:
项目 | 价格 |
---|---|
Computer | $1600 |
Phone | $12 |
Pipe | $1 |
可以使用冒号来定义对齐方式:
项目 | 价格 | 数量 |
---|---|---|
Computer | 1600 元 | 5 |
Phone | 12 元 | 12 |
Pipe | 1 元 | 234 |
定义列表
-
Markdown Extra 定义列表语法:
项目1
项目2
- 定义 A
- 定义 B 项目3
- 定义 C
-
定义 D
定义D内容
代码块
代码块语法遵循标准markdown代码,例如:
@requires_authorization
def somefunc(param1='', param2=0):
'''A docstring'''
if param1 > param2: # interesting
print 'Greater'
return (param2 - param1 + 1) or None
class SomeClass:
pass
>>> message = '''interpreter
... prompt'''
脚注
生成一个脚注1.
目录
用 [TOC]
来生成目录:
数学公式
使用MathJax渲染LaTex 数学公式,详见math.stackexchange.com.
- 行内公式,数学公式为: Γ(n)=(n−1)!∀n∈N 。
- 块级公式:
更多LaTex语法请参考 这儿.
UML 图:
可以渲染序列图:
或者流程图:
离线写博客
即使用户在没有网络的情况下,也可以通过本编辑器离线写博客(直接在曾经使用过的浏览器中输入write.blog.youkuaiyun.com/mdeditor即可。Markdown编辑器使用浏览器离线存储将内容保存在本地。
用户写博客的过程中,内容实时保存在浏览器缓存中,在用户关闭浏览器或者其它异常情况下,内容不会丢失。用户再次打开浏览器时,会显示上次用户正在编辑的没有发表的内容。
博客发表后,本地缓存将被删除。
用户可以选择 把正在写的博客保存到服务器草稿箱,即使换浏览器或者清除缓存,内容也不会丢失。
注意:虽然浏览器存储大部分时候都比较可靠,但为了您的数据安全,在联网后,请务必及时发表或者保存到服务器草稿箱。
浏览器兼容
- 目前,本编辑器对Chrome浏览器支持最为完整。建议大家使用较新版本的Chrome。
- IE9以下不支持
- IE9,10,11存在以下问题
- 不支持离线功能
- IE9不支持文件导入导出
- IE10不支持拖拽文件导入
- 这里是 脚注 的 内容. ↩