
图像处理
文章平均质量分 78
qq_43133135
这个作者很懒,什么都没留下…
展开
-
人脸特征点检测入门
人脸特征点可以用来做脸型、眼睛形状、鼻子形状等分析,从而对人脸的特定位置进行修饰加工,实现人脸的特效美颜。人脸识别等算法可以通过对人脸的姿态进行对齐从而提高模型的精度。68点标注是现今最通用的一种标注方案,早期在1999年的Xm2vtsdb数据集中就被提出,300W数据集和XM2VTS等数据集也都采用了68个关键点的方案,Dlib算法中所采用。Dlib所采用的68个人脸关键点标注可以看上图,单边眉毛有5个关键点,从左边界到右边界均匀采样,共5×2=10个。原创 2022-12-10 22:12:13 · 4260 阅读 · 0 评论 -
3D立体匹配入门 - 视差计算
1、左右视图成功匹配的窗口,具有相同的像素2、像素P的视差只与其领域有关3、相近颜色的点具有相近的视差4、视差非连续区,应具有颜色差或亮度差上述这些假设都作为各类算法的切入点,详细可以观看 立体匹配理论与实战一般分为四种:局部、全局、半全局、基于深度学习的匹配,前三种都是传统的算法。如经典的SDA匹配,使用左视图的窗口减去右视图的窗口,得到SDA值最小很可能就是真实视差。不过这样计算出来的一般都比较粗糙,我们一般只用来做初始代价计算,然后得到DSI(视差空间影像),这是一个三维数组(尺寸是w×h×d)原创 2022-12-08 12:41:52 · 1942 阅读 · 0 评论 -
图像变形 -- 移动最小二乘法(MLS)
根据变换矩阵的不同,可以分为三种变形方法,分别是:仿射变换、相似变换、刚性变换。这边从基本原理进行算法公式推导原创 2022-12-04 05:45:04 · 2046 阅读 · 1 评论 -
NFA虚假警报数
二项分布是n个独立的成功/失败试验中离散概率。举个实例,在一次试验中硬币要么正面朝上,要么反面朝上,每次正面朝上的概率都一样p=0.5,且每次抛硬币的事件相互独立,即每次正面朝上的概率不受其他试验的影响。如果独立重复抛n=10次硬币,可能为0,1,2,3,4,5,6,7,8,9,10中的任何一个,那么k显然是一个随机变量,其成功概率。P(x=k)=Ckn×pk×(1−p)(n−k)简记: x ~B(n,p)原创 2022-08-20 16:31:58 · 364 阅读 · 0 评论 -
EDCircles: A real-time circle detector with a false detection control 翻译
论文名:EDCircles:一个带有错误检测控制的实时圆检测器[1]…原创 2022-07-05 10:13:01 · 2072 阅读 · 0 评论 -
Edge Drawing: A combined real-time edge and segment detector 翻译
边缘绘制:结合实时边缘和分割检测器原创 2022-06-30 19:50:21 · 3014 阅读 · 4 评论 -
EDLines: A real-time line segment detector with a false detection control翻译
论文名 :EDLines:一个具有误检控制的实时线段检测器原创 2022-06-30 23:21:36 · 2591 阅读 · 0 评论 -
GrabCut分析
中心像素和邻域像素的相似性有两个部分:位置相似和像素值相似位置相似性:两个像素位置越接近,我们认为越相似。如以C为中心的邻域内,A和C的距离是dis=2dis=\sqrt2dis=2,B和C的距离是dis=1dis=1dis=1,相似性可以用spos=1diss_{pos}=\frac{1}{dis}spos=dis1来衡量像素值相似:两个像素颜色越接近,我们认为越相似。如A和C的L2距离是dL2=∣v(a)−v(b)∣2d_{L2}=|v(a)-v(b)|^2dL2=∣v(a)−v(b)∣2。原创 2022-06-10 07:20:28 · 416 阅读 · 0 评论 -
opencv 2.49 Kmeans.cpp源码分析
源码位于opencv-2.4.9\modules\ocl\src\kmeans.cpp主要就是两个函数,一个是中心点选取法:The Advantages of Careful Seeding,另一个是kmeans算法generateCentersPP函数对应于k-means++的中心点初始化引入随机化,下一个被选为中心点的样本不是固定的,而是一个概率值,这个概率值正比于“整体最小距离“。/*k-means center initialization using the following a原创 2022-05-30 09:31:08 · 355 阅读 · 0 评论 -
主动轮廓模型snake
原理概述snake模型将图像分割问题转换为求解能量泛函最小值的问题。主要思路是构造能量函数进行迭代后,轮廓曲线由初始位置逐渐向使能量函数最小(局部极小)的图像边缘逼近,最终分割出目标。曲线理论假设一条光滑封闭曲线 C=C(p)C(p)C(p),则在点p处有切向量T(p)T(p)T(p)和法向量N(p)N(p)N(p)相互垂直:且有dCdp=T(p)\frac{dC}{dp}=T(p)dpdC=T(p), d2Cdp2=kN(p)\frac{d^2C}{dp^2}=kN(p)dp2d2C=kN(原创 2022-05-09 12:48:58 · 1298 阅读 · 0 评论 -
黑白点图的生成法
随机阈值法每个像素点都采用(0~255)的随机阈值进行二值化。等级概率密度法先把图像进行像素分级,比如保留四级的灰度。然后对每个灰度计算黑色像素的概率分布:当前像素为最低等级,黑点概率为1当前像素为最高等级,黑点概率为0假设概率P随等级变化线性分布,计算出分布:建立分布表 P[grades][gradesmax],其中grades为等级,gradesmax为等级最大取值,即grades-1然后对每个像素进行概率密度映射,计算随机概率映射到该表中,得到输出值。Halftonin原创 2022-02-25 05:44:56 · 1505 阅读 · 0 评论 -
PNN概率神经网络
1、贝叶斯决假设对于测试样本xxx,共有mmm中类别可能 {w1,⋯,wm}\{ w_1 , ⋯ , w _m\}{w1,⋯,wm},则判断样本类别的贝叶斯决策是:max{p(w1∣x),p(w2∣x),⋯ ,p(wm∣x)}\max \{ p({w_1}\left| x \right.),p({w_2}\left| x \right.), \cdots ,p({w_m}\left| x \right.)\}max{p(w1∣x),p(w2∣x),⋯,p(wm∣x)}2、PNN网络如下原创 2022-02-24 05:43:20 · 4098 阅读 · 0 评论 -
相位相关匹配
背景知识傅里叶平移不变性首先介绍一下傅里叶变换,傅里叶变换的作用,便是将一个信号分解为正弦函数的组合。其逆变换就是将正弦函数组合,合成一个信号。对于一个确定频率为 ω\omegaω 的正弦波,其有如下性质:sin(ωt+θ)=α×sin(ωt)+β×cos(ωt)sin(\omega t+\theta)=\alpha\times sin(\omega t)+\beta\times cos(\omega t)sin(ωt+θ)=α×sin(ωt)+β×cos(ωt)由中学三角函数分解公式可得: α=c原创 2022-02-15 23:16:32 · 2425 阅读 · 0 评论 -
相机标定详解
相机标定原理详解相机成像原理小孔成像与像素坐标图像坐标系与相机坐标系相机的内参和外参外参矩阵与内参矩阵齐次坐标与向量的区别图像畸变与矫正径向畸变相机成像原理小孔成像与像素坐标小孔成像原理如下图所示(焦点就是等价的小孔):我们通常的相机,都是在上图像平面的位置放一块感光板来接收图像,接收到的图像,有一个像素坐标系在上图中,任意一个像素点的坐标可以表示为(ui,vi)(u_i,v_i)(ui,vi)。图像坐标系与相机坐标系图像坐标系是以图像中心为原点的坐标系,由像素坐标平移得到:在图中原创 2021-05-06 17:47:52 · 1162 阅读 · 1 评论 -
RGB及sRGB与XYZ坐标转换
sRGB是RGB伽马矫正后输出的数据sRGB转换XYZ公式我们知道RGB转sRGB的伽马变换公式,先对三通道进行缩放到(0~1):再进行矩阵变换:XYZ转换sRGB公式xyz转srgb矩阵变换如下变换回RGB(0~255)原创 2021-04-02 16:13:36 · 8470 阅读 · 5 评论 -
SSIM结构相似性算法
应用场景结构相似性,是一种衡量两幅图像相似度的指标,通常用作图像质量评估,在图像重建、压缩领域,可以计算输出图像与原图的差距。MSE有很多算法可以计算输出图像与原图的差距,其中最常用的一种是 Mean Square Error loss(MSE)。它的计算公式很简单:MSE=1n∑[Ii−Ki]2MSE=\frac{1}{n} \sum [I_i-K_i]^{2}MSE=n1∑[Ii−Ki]2就是计算重建图像与输入图像的像素差的平方,然后在全图上求平均。有时候两张图片只是亮度不同,但是之间原创 2020-12-18 12:42:00 · 6021 阅读 · 0 评论 -
NCC模板匹配
NCC算法首先进行向量归一化操作,S=Si,j−meanSS=S_{i,j}-meanSS=Si,j−meanS,T=Ti,j−meanTT=T_{i,j}-meanTT=Ti,j−meanT然后计算两个向量的余弦相似度:cos(R)=S∗T/(S2∗T2)cos(R)=S*T/(\sqrt{S^2} *\sqrt{T^2})cos(R)=S∗T/(S2∗T2)分母第一部分优化:∑(Si−Sˉ)2=∑(Si−∑Sin)2\sum({S_i}-\bar{S})^2=\sum({S_i}-原创 2020-12-13 21:01:37 · 2657 阅读 · 0 评论 -
引导滤波GuidedFilter
何恺明读博士提出基于暗通道采用引导滤波去雾算法获CVPR2009最佳论文,现在应用面很广、很广;能够克服双边滤波的梯度翻转现象,在滤波后图像的细节上更优,主要美颜算法差不多都用这个。先贴伪代码:实现的话可以采用积分图加速。线性滤波器其中I是引导图像,P是输入的待滤波图像,W是根据引导图I确定的权重值,Q是滤波后的输出图像。1、如果权重W与引导图无关,那便是一个常量,比如高斯滤波那种,这种我们相对就特别好理解。2、如果权重与引导图相关,我们的图像就会受到引导图影响,比如双边滤波中,我们采用和原创 2020-12-13 13:49:42 · 1302 阅读 · 0 评论 -
LBP人脸识别
LBP特征LBP特征呢网上比较多,就不多说了,就是邻域像素和中心点像素比较,二值化后排列成8位,将这8位组合成一个unsigned char变量,就是该中心点处的LBP特征,对每个点执行该运算,则形成一幅LBP图。LBP等价模式由于LBP取值范围是【0–255】,特征太多,所以抽取其中的等价模式,一共59个。抽取方式就是循环一圈,计算跳变次数,按跳变次数将LPB特征分为两类:1、跳变次数不超过2次(如边缘、角点会有两次,平面则只有0次)1、跳变次数超过2次LBP直方图按照等价模式,对一个原创 2020-12-13 12:07:42 · 989 阅读 · 0 评论 -
VS2017中使用OpenCVSharp
新建一个c#的控制台程序:写下hello world测试程序,编译通过:打开NuGet程序包管理器搜索并找到opencvsharp配置并安装:安装成功如下:打开项目文件夹,会发现多了一个pack:可以看到,她它就在里面:在控制台下面修改代码如下:成功显示如下:到此结束。如果抛出异常如下:检查检查图片路径名称,可能是图片不存在,或者路径不对。...原创 2020-07-26 09:21:42 · 1005 阅读 · 0 评论