第三章:OpenCV进阶应用
3.1 特征检测与描述
特征检测是计算机视觉的重要任务,用于识别图像中的关键点,并为关键点生成描述符,便于图像匹配和场景理解。
3.1.1 角点检测
1. Harris角点检测
Harris角点检测通过计算图像梯度的变化,定位角点。
python
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = np.float32(gray)
corners = cv2.cornerHarris(gray, blockSize=2, ksize=3, k=0.04)
img[corners > 0.01 * corners.max()] = [0, 0, 255] # 标记角点
2. Shi-Tomasi角点检测
改进版的Harris角点检测,更适合子像素级别的精确检测。
python
corners = cv2.goodFeaturesToTrack(gray, maxCorners=100, qualityLevel=0.01, minDistance=10)
for corner in corners:
x, y = np.int0(corner.ravel())
cv2.circle(img, (x, y), 5, (0, 255, 0), -1)
3.1.2 特征点描述与匹配
1. SIFT与SURF
- SIFT(Scale-Invariant Feature Transform):对尺度和旋转变化具有鲁棒性。
- SURF(Speeded-Up Robust Features):计算更快,但精度稍低。
python
# 初始化SIFT检测器
sift = cv2.SIFT_create()
keypoints, descriptors = sift.detectAndCompute(img, None)
# 绘制关键点
cv2.drawKeypoints(img, keypoints, img, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
2. ORB(Oriented FAST and Rotated BRIEF)
ORB是一个高效且免费的特征检测算法。
python
orb = cv2.ORB_create()
keypoints, descriptors = orb.detectAndCompute(img, None)
3. 特征匹配
通过BFMatcher
或FLANN
匹配关键点。
python
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
matches = bf.match(des1, des2)
matches = sorted(matches, key=lambda x: x.distance)
cv2.drawMatches(img1, kp1, img2, kp2, matches[:10], None)
3.2 图像匹配与几何变换
3.2.1 图像拼接
通过特征匹配与单应性矩阵(Homography)实现图像拼接。
python
# 计算单应性矩阵
H, _ = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)
result = cv2.warpPerspective(img1, H, (width, height))
3.2.2 透视变换
用于对图像中的对象进行角度校正。
python
pts1 = np.float32([[50, 50], [200, 50], [50, 200], [200, 200]])
pts2 = np.float32([[10, 100], [200, 50], [100, 250], [300, 200]])
M = cv2.getPerspectiveTransform(pts1, pts2)
warped = cv2.warpPerspective(img, M, (300, 300))
3.3 视频处理基础
3.3.1 视频流的捕获与显示
通过摄像头读取并显示视频流。
python
cap = cv2.VideoCapture(0) # 摄像头
while cap.isOpened():
ret, frame = cap.read()
if not ret:
break
cv2.imshow('Video Stream', frame)
if cv2.waitKey(1) & 0xFF == ord('q'):
break
cap.release()
cv2.destroyAllWindows()
3.3.2 背景减除与运动检测
使用背景建模技术实现运动目标的检测。
python
fgbg = cv2.createBackgroundSubtractorMOG2()
while True:
ret, frame = cap.read()
fgmask = fgbg.apply(frame)
cv2.imshow('Foreground Mask', fgmask)
if cv2.waitKey(1) & 0xFF == ord('q'):
break