
计算机视觉
文章平均质量分 78
计算机视觉、图像处理算法等
此人姓于名叫罩百灵
河北pia县八宝山剧团著名相声表演艺术家,擅长割麦子,腌松花,代表作《打倒郭の纲》。曾获外国人讲普通话大赛二等奖,多次在偏远山区及原始部落强行慰问演出,受到同行和乡亲们的一致好评。
展开
-
学习Transformer:自注意力与多头自注意力的原理及实现
自从Transformer[3]模型在NLP领域问世后,基于Transformer的深度学习模型性能逐渐在NLP和CV领域(Vision Transformer)取得了令人惊叹的提升。本文的主要目的是介绍经典Transformer模型和Vision Transformer的技术细节及基本原理,以方便读者在CV领域了解和使用Vision Transformer。......原创 2022-05-15 07:55:27 · 22299 阅读 · 8 评论 -
计算机视觉数据集介绍:KITTI数据集
KITTI数据集是由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,利用组装的设备齐全的采集车辆对实际交通场景进行数据采集获得的公开数据集。该数据集包含丰富多样的传感器数据(有双目相机、64线激光雷达、GPS/IMU组合导航定位系统,基本满足对图像、点云和定位数据的需求)、大量的标定真值(包括检测2D和3D包围框、跟踪轨迹tracklet)和官方提供的一些开发工具等。...原创 2022-03-17 18:23:48 · 17939 阅读 · 1 评论 -
计算机视觉基础:霍夫变换(Computer Vision Fundamentals: Hough Transform)
本文主要介绍了图像处理技术中的霍夫变换原理,同时介绍了OpenCV中实现的概率霍夫变换基本原理及流程。原创 2021-03-24 22:32:39 · 894 阅读 · 0 评论 -
计算机视觉基础:自适应阈值分割(Computer Vision Fundamentals: Adaptive Threshold Segmentation)
阈值分割方法虽然简单,但是如果场景简单,还是可以尝试使用的,因为其消耗的时间较少。同时,阈值分割也可以作为一个baseline来验证提出的新算法是否有效。本文主要介绍了OpenCV中介绍的两种自适应阈值分割算法,在实际工程中较常使用。原创 2021-03-24 22:26:44 · 4321 阅读 · 1 评论 -
利用numpy.gradient计算图像梯度
numpy.gradient(): 计算n维数组的梯度,返回和原始数组同样大小的结果。说明对于1维的数组:两个边界的元素直接用后一个减去前一个值,得到梯度,即b−ab-ab−a;对于中间的元素,取相邻两个元素差的一半,即(c−a)/2(c-a) / 2(c−a)/2。如:In [2]: f = np.array([1, 2, 4, 7, 11, 16], dtype=np.float)...原创 2020-04-13 18:24:42 · 7907 阅读 · 0 评论 -
图像分割算法: 随机游走(Random Walk Segmentation Algorithm)
Random Walk 算法是比较早的一种基于图的方法,其原始论文[1]最早发在一个会议上, 后来经过修整发在期刊上[2].其主要思想是将图像构建成一个无向图模型,然后通过求解对应的dirichlet问题[3, 4]得到分割结果。本文主要介绍一些random walker算法的原理,推导过程以及一些实验结果。...原创 2020-04-13 18:20:42 · 12348 阅读 · 6 评论 -
图像的连通域标记算法及工具介绍
之前在优快云上介绍过一个关于如何使用skimage以及opencv标记二值图像的连通域问题。实际上估计不是太多的人懂得标记连通域的原理,加上在医学图像处理中,我们常常用到3维图像,而上述工具只解决了2维图像上的情况,并不支持3维图像的标记(目前还不支持),因此有必要对这个连通域标记算法进行进一步说明。...原创 2020-04-13 18:07:27 · 5114 阅读 · 10 评论 -
学习opencv: 鼠标提取矩形(Rectangle)ROI
本文介绍了采用python opencv进行交互画出矩形框,并根据矩形框对目标图像进行截取的方法。原创 2020-04-13 18:02:21 · 1601 阅读 · 0 评论 -
python工具包: pandas
引言Pandas具有超强的数据处理能力,似乎是目前处理日常csv和Excel文件中最好用的工具包。结合Matplotlib工具包,基本可以满足上述两种文件的处理和显示工作。数据结构我们介绍Pandas中的两种主要数据结构:Series与DataFrame,其示意图如下所示:从上图可以看出,Series由一个一维数组(values)和与之对应的索引(index)组成。这个结构看起来和pyt...原创 2020-04-10 13:17:52 · 1783 阅读 · 0 评论 -
大恒水星相机硬触发测试
大恒水星相机硬触发测试,c++实现。原创 2018-07-12 22:34:40 · 5084 阅读 · 6 评论 -
使用opencv实现matlab中的imfill填充孔洞功能
使用opencv实现matlab中的imfill填充孔洞功能,整体思路如下:1.首先给原始图像四周加一圈全0,并保存为另一幅图像2.使用floodFill函数给新图像进行填充,种子点设置为Point(0, 0),填充颜色为全白。因为原始图像四周加了一圈0,因此使用floodFill填充之后,整个图像除了原始图像中内部的点是黑色之外其他地方全是白色。3....原创 2017-07-14 10:56:02 · 4455 阅读 · 1 评论 -
单应性变换(Homography)
import cv2import numpy as npimport pylab as pl if __name__ == '__main__' : # Read source image. im_src = cv2.imread('book2.jpg') # Four corners of the book in source image p翻译 2017-04-28 15:48:31 · 26077 阅读 · 5 评论 -
学习opencv: 获取图像最大连通域 c++和python版
之前写过一个基于opencv2.x中findContours函数的最大连通域标记方法,但该程序会受各个contours之间hierarchy的影响而出错。本文给出一种基于连通域标记的最大连通域提取方法,并在已有图像上验证了python和c++版本的有效性。...原创 2018-07-12 22:50:48 · 53173 阅读 · 17 评论 -
学习opencv: 使用边缘信息提升全局阈值分割的性能
使用全局阈值分割图像的一个基本条件是前景和背景的直方图波峰之间有足够的空隙,这样将阈值设置在空隙之间就可以将前景和背景分开。原创 2017-06-08 18:00:23 · 2467 阅读 · 2 评论 -
opencv findContuors 详解
官网的解释很明白,结合http://blog.youkuaiyun.com/jfuck/article/details/9620889画了两个图一起解释就直观了。主要的方法来自Suzukietc. 1985这篇1985年的论文。 函数原型:C++: void findContours(InputOutputArray image,OutputArrayOfArrays contours, Ou原创 2017-05-31 20:40:37 · 1746 阅读 · 0 评论 -
opencv fillConvexPoly深究
Opencv FillconvexPoly函数给定一个多边形的角点(按顺序),就可以把角点内的多边形填充成想要的颜色,但是一个问题是角点之间的连线填充不填充,为了验证这个问题,写了几行脚本加以验证,又到了大家最喜欢的上代码时间了:import cv2import numpy as npimport matplotlib.pyplot as pltimg = np.zeros((100, ...原创 2017-05-27 13:44:00 · 8675 阅读 · 0 评论 -
模式识别基础知识
一、特征提取概念:特征是某一类对象区别于其他类对象的特点,通过测量或者处理取得的数据通常将多个特征组合到一起,形成一个向量。一个N维的特征就是N维空间中的一个点常用的特征:1、区域描述子周长、面积、紧致性(C = 1-4*pi*a/p^2)、灰度均值、灰度方差2、形状特征傅里叶描述子 :基本思想是将形状曲线建模为一维序列,然后进行傅里叶变换,从而得到傅里叶描述子原创 2015-12-29 17:45:03 · 2834 阅读 · 0 评论 -
图像处理基础知识
图像处理基本概念图像类型X射线成像当X线透过物体不同结构时,被吸收的程度不同,所以到达荧屏或胶片上的X线量有差异,因而形成明暗不同的图像。可见光成像红外成像红外线成像仪就是利用红外检测器的光敏元件,接收物体发出的红外线能量,形成图像。红外光不是人眼所能看到的目标可见光图像,而是目标表面温度分布图像。磁共振成像把病人放在强磁场中,然后施加某种特定频率的射频脉冲原创 2015-12-29 16:07:32 · 747 阅读 · 0 评论 -
图像处理一些常用的网站
一、研究群体http://www-2.cs.cmu.edu/~cil/vision.html这是卡奈基梅隆大学的计算机视觉研究组的主页,上面提供很全的资料,从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件,甚至还有一个搜索引擎。http://www.cmis.csiro.au/IAP/zimage.htm这是一个侧重图像分析的站点,一般。但是提供一个Ima转载 2015-03-07 16:26:46 · 682 阅读 · 0 评论