【算法分析】Lucas–Kanade光流算法

本文介绍Lucas-Kanade光流算法的基本原理及其应用。该算法通过估算两帧间像素位移,解决计算机视觉中的光流问题。文章详细解释了图像约束方程及如何使用最小二乘法解决超定方程问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


简介:在计算机视觉中,Lucas–Kanade光流算法是一种两帧差分的光流估计算法。它由Bruce D. Lucas  Takeo Kanade提出。

光流的概念:(Optical flow or optic flow)
它是一种运动模式,这种运动模式指的是一个物体、表面、边缘在一个视角下由一个观察者(比如眼睛、摄像头等)和背景之间形成的明显移动。光流技术,如运动检测和图像分割,时间碰撞,运动补偿编码,三维立体视差,都是利用了这种边缘或表面运动的技术。

二维图像的移动相对于观察者而言是三维物体移动的在图像平面的投影。
有序的图像可以估计出二维图像的瞬时图像速率或离散图像转移。

光流算法:
它评估了两幅图像的之间的变形,它的基本假设是体素和图像像素守恒。它假设一个物体的颜色在前后两帧没有巨大而明显的变化。基于这个思路,我们可以得到图像约束方程。不同的光流算法解决了假定了不同附加条件的光流问题。

Lucas–Kanade
算法:
这个算法是最常见,最流行的。它计算两帧在时间t + δt之间每个每个像素点位置的移动。 由于它是基于图像信号的泰勒级数,这种方法称为差分,这就是对于空间和时间坐标使用偏导数。
图像约束方程可以写为I (x ,y ,z ,t ) = I (x + δx ,y + δy ,z + δz ,t + δt )
I(x, y,z, t) 
为在(x,y,z)位置的体素。
我们假设移动足够的小,那么对图像约束方程使用泰勒公式,我们可以得到:

H.O.T. 指更高阶,在移动足够小的情况下可以忽略。从这个方程中我们可以得到:

或者

我们得到:


V x ,V y ,V z 
分别是I(x,y,z,t)的光流向量中xyz的组成。  则是图像在(x ,y ,z ,t )这一点向相应方向的差分 
所以

I x V x I y V y I z V z = − t

写做:

这个方程有三个未知量,尚不能被解决,这也就是所谓光流算法的光圈问题。那么要找到光流向量则需要另一套解决的方案。而Lucas-Kanade算法是一个非迭代的算法:

假设流(Vx,Vy,Vz)在一个大小为m*m*m(m>1)的小窗中是一个常数,那么从像素1...n , n = m 3 中可以得到下列一组方程:

三个未知数但是有多于三个的方程,这个方程组自然是个超定方程,也就是说方程组内有冗余,方程组可以表示为:

记作:

为了解决这个超定问题,我们采用最小二乘法:

or

得到:

其中的求和是从1n

这也就是说寻找光流可以通过在四维上图像导数的分别累加得出。我们还需要一个权重函数W(i, j,k)  来突出窗口中心点的坐标。高斯函数做这项工作是非常合适的,

这个算法的不足在于它不能产生一个密度很高的流向量,例如在运动的边缘和黑大的同质区域中的微小移动方面流信息会很快的褪去。它的优点在于有噪声存在的鲁棒性还是可以的。

补充:opencv里实现的看上去蛮复杂,现在还不是太明白。其中LK经典算法也是迭代法,是由高斯迭代法解线性方程组进行迭代的。

参考文献:Lucas B and Kanade T. An Iterative Image Registration Technique with an Application to Stereo Vision. Proc. Of 7th International Joint Conference on Artificial Intelligence (IJCAI), pp.674-679.81年发表的。

opencv中实现的是84年发表的算法,

参考文献:Bruce D. Lucas , "Generalized Image Matching by the Method of Differences," doctoral dissertation, tech. report , Robotics Institute, Carnegie Mellon University, July, 1984

这篇论文是收费的,一直都没下到还。


### Lucas-Kanade 流算法原理 Lucas-Kanade 流算法是一种经典的计算机视觉技术,主要用于估计图像序列中的运动。该算法的核心思想是利用时间连续性和空间局部性的假设,在一个小区域内近似认为所有像素具有相同的运动矢量[^3]。 #### 数学模型 Lucas-Kanade 方法通过最小化邻域内的像素误差来估计流。其目标函数可以表示为: \[ E(u,v) = \sum_{(x,y)} [I(x+u, y+v, t+1) - I(x, y, t)]^2 W(x,y) \] 其中 \(I(x, y, t)\) 表示当前帧的灰度值,\(I(x+u, y+v, t+1)\) 是下一帧对应位置的灰度值,而 \(W(x,y)\) 则是一个加权窗口函数,通常采用高斯权重分布。 为了简化求解过程,引入了泰勒展开近似和亮度恒定假设(即同一物体在相邻两帧间的亮度不变),从而得到线性方程组的形式: \[ \begin{bmatrix} \nabla I_x \\ \nabla I_y \end{bmatrix}^\top \cdot \begin{bmatrix} u \\ v \end{bmatrix} = -\nabla I_t \] 最终可以通过矩阵运算解决上述方程组,获得流矢量 \((u, v)\)[^5]。 --- ### OpenCV 中的实现方法 OpenCV 提供了一个高效的接口 `cv2.calcOpticalFlowPyrLK()` 来计算稀疏流。以下是其实现的主要步骤: 1. **提取特征点** 首先需要从初始帧中提取一组稳定的特征点(如角点)。这一步可通过 Harris 角点检测器或 Shi-Tomasi 特征检测器完成。 2. **构建金字塔结构** 由于流算法可能无法处理大位移的情况,因此常使用图像金字塔降低分辨率,逐步逼近真实运动矢量[^4]。 3. **调用核心 API** 调用 `cv2.calcOpticalFlowPyrLK(prevImg, nextImg, prevPts)` 函数即可获取前后两帧之间的匹配点及其对应的流矢量。 下面是一段完整的 Python 示例代码展示如何应用此功能: ```python import numpy as np import cv2 # 初始化视频捕获设备 cap = cv2.VideoCapture('input_video.mp4') # 创建参数用于 ShiTomasi 角点检测 feature_params = dict(maxCorners=100, qualityLevel=0.3, minDistance=7, blockSize=7) # 设置 LK 流参数 lk_params = dict(winSize=(15, 15), maxLevel=2, criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03)) # 获取第一帧并查找角点 ret, old_frame = cap.read() old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY) p0 = cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params) mask = np.zeros_like(old_frame) while True: ret, frame = cap.read() if not ret: break frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 计算流 p1, st, err = cv2.calcOpticalFlowPyrLK(old_gray, frame_gray, p0, None, **lk_params) # 选择好的点 good_new = p1[st == 1] good_old = p0[st == 1] # 绘制轨迹 for i, (new, old) in enumerate(zip(good_new, good_old)): a, b = new.ravel().astype(int) c, d = old.ravel().astype(int) mask = cv2.line(mask, (a,b), (c,d), (0, 255, 0), 2) frame = cv2.circle(frame, (a,b), 5, (0, 0, 255), -1) img = cv2.add(frame, mask) cv2.imshow('frame', img) k = cv2.waitKey(30) & 0xff if k == 27: break # 更新前一帧和前一点集 old_gray = frame_gray.copy() p0 = good_new.reshape(-1, 1, 2) cv2.destroyAllWindows() cap.release() ``` --- ### 总结 Lucas-Kanade 流算法以其高效性和准确性成为许多实时应用场景的基础工具之一。尽管它是稀疏流的一种形式,但在实际开发过程中往往能够满足大多数需求。如果需要更精确的结果,则可以考虑结合其他密集型流算法(如 Horn-Schunck 法)或者现代深度学习框架下的端到端解决方案。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值