图像识别边缘算法

原创于 2025-07-28 19:11:18 发布 · 1.4k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#算法

OpenCV 专栏收录该内容

7 篇文章

订阅专栏

文章目录

1. 基本概念

边缘检测是图像处理和计算机视觉中的基础技术，用于识别图像中物体的边界。边缘是指图像中像素强度发生急剧变化的区域，通常对应于物体的轮廓、纹理变化或光照变化。

2. 边缘检测原理

边缘检测的基本原理是通过计算图像中像素的梯度来检测边缘。梯度表示像素强度变化的速率和方向。在边缘处，像素强度会发生显著变化，因此梯度值会很大。

边缘类型：

阶跃边缘：像素强度突然变化
屋顶边缘：像素强度逐渐变化后恢复
线条边缘：细线状结构

3. 常见边缘检测算法

3.1 Sobel算子

Sobel算子是一种基于梯度的边缘检测算法，通过计算图像在水平和垂直方向上的梯度来检测边缘。

import cv2
import numpy as np
import matplotlib.pyplot as plt

def sobel_edge_detection(image):
    """
    使用Sobel算子进行边缘检测
    """
    # 转换为灰度图像
    if len(image.shape) == 3:
        gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    else:
        gray = image
    
    # 计算x和y方向的梯度
    sobelx = cv2.Sobel(gray, cv2.CV_64F, 1, 0, ksize=3)
    sobely = cv2.Sobel(gray, cv2.CV_64F, 0, 1, ksize=3)
    
    # 计算梯度幅值
    sobel_combined = np.sqrt(sobelx**2 + sobely**2)
    
    return sobelx, sobely, sobel_combined

# 示例使用
# image = cv2.imread('sample.jpg')
# sobelx, sobely, sobel_combined = sobel_edge_detection(image)

3.2 Canny边缘检测

Canny边缘检测是一种多阶段算法，被认为是边缘检测的黄金标准。

def canny_edge_detection(image, low_threshold=50, high_threshold=150):
    """
    使用Canny算法进行边缘检测
    """
    # 转换为灰度图像
    if len(image.shape) == 3:
        gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    else:
        gray = image
    
    # 应用高斯滤波去噪
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)
    
    # Canny边缘检测
    edges = cv2.Canny(blurred, low_threshold, high_threshold)
    
    return edges

# 示例使用
# edges = canny_edge_detection(image)

3.3 Laplacian算子

Laplacian算子是二阶导数算子，对噪声敏感但能检测到更精细的边缘。

def laplacian_edge_detection(image):
    """
    使用Laplacian算子进行边缘检测
    """
    # 转换为灰度图像
    if len(image.shape) == 3:
        gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    else:
        gray = image
    
    # 应用高斯滤波去噪
    blurred = cv2.GaussianBlur(gray, (3, 3), 0)
    
    # Laplacian边缘检测
    laplacian = cv2.Laplacian(blurred, cv2.CV_64F)
    
    return laplacian

4. Canny边缘检测详细流程

Canny边缘检测算法包含以下几个步骤：

流程图示例：

原始图像
    ↓
转换为灰度图像
    ↓
高斯滤波去噪
    ↓
计算梯度幅值和方向
    ↓
非极大值抑制
    ↓
双阈值检测
    ↓
边缘连接(滞后阈值)
    ↓
最终边缘图像

详细步骤说明：

灰度化：将彩色图像转换为灰度图像
噪声去除：使用高斯滤波器平滑图像
梯度计算：计算每个像素的梯度幅值和方向
非极大值抑制：细化边缘，使边缘只有一个像素宽
双阈值检测：使用高低阈值确定强边缘和弱边缘
边缘连接：通过滞后阈值连接边缘

def detailed_canny_process(image):
    """
    详细展示Canny边缘检测的每个步骤
    """
    # 步骤1: 转换为灰度图像
    if len(image.shape) == 3:
        gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    else:
        gray = image
    
    # 步骤2: 高斯滤波去噪
    blurred = cv2.GaussianBlur(gray, (5, 5), 1.4)
    
    # 步骤3: 计算梯度
    # 使用Sobel算子计算梯度
    grad_x = cv2.Sobel(blurred, cv2.CV_64F, 1, 0, ksize=3)
    grad_y = cv2.Sobel(blurred, cv2.CV_64F, 0, 1, ksize=3)
    
    # 计算梯度幅值和方向
    magnitude = np.sqrt(grad_x**2 + grad_y**2)
    angle = np.arctan2(grad_y, grad_x)
    
    # 步骤4: 非极大值抑制
    suppressed = non_maximum_suppression(magnitude, angle)
    
    # 步骤5: 双阈值检测
    weak = 50
    strong = 150
    thresholded = double_threshold(suppressed, weak, strong)
    
    # 步骤6: 边缘连接
    edges = hysteresis(thresholded, weak, strong)
    
    return edges

def non_maximum_suppression(magnitude, angle):
    """
    非极大值抑制
    """
    rows, cols = magnitude.shape
    suppressed = np.zeros((rows, cols), dtype=np.int32)
    angle = angle * 180. / np.pi
    angle[angle < 0] += 180
    
    for i in range(1, rows-1):
        for j in range(1, cols-1):
            try:
                q = 255
                r = 255
                
                # 角度0度
                if (0 <= angle[i,j] < 22.5) or (157.5 <= angle[i,j] <= 180):
                    q = magnitude[i, j+1]
                    r = magnitude[i, j-1]
                # 角度45度
                elif (22.5 <= angle[i,j] < 67.5):
                    q = magnitude[i+1, j-1]
                    r = magnitude[i-1, j+1]
                # 角度90度
                elif (67.5 <= angle[i,j] < 112.5):
                    q = magnitude[i+1, j]
                    r = magnitude[i-1, j]
                # 角度135度
                elif (112.5 <= angle[i,j] < 157.5):
                    q = magnitude[i-1, j-1]
                    r = magnitude[i+1, j+1]

                if (magnitude[i,j] >= q) and (magnitude[i,j] >= r):
                    suppressed[i,j] = magnitude[i,j]
                else:
                    suppressed[i,j] = 0

            except IndexError as e:
                pass
    
    return suppressed

def double_threshold(img, weak, strong):
    """
    双阈值检测
    """
    high_threshold = img.max() * 0.2
    low_threshold = high_threshold * 0.05
    
    rows, cols = img.shape
    result = np.zeros((rows, cols), dtype=np.int32)
    
    weak_i, weak_j = np.where((img <= high_threshold) & (img >= low_threshold))
    strong_i, strong_j = np.where(img >= high_threshold)
    
    result[strong_i, strong_j] = strong
    result[weak_i, weak_j] = weak
    
    return result

def hysteresis(img, weak, strong):
    """
    边缘连接（滞后阈值）
    """
    rows, cols = img.shape
    
    for i in range(1, rows-1):
        for j in range(1, cols-1):
            if (img[i,j] == weak):
                try:
                    if ((img[i+1, j-1] == strong) or (img[i+1, j] == strong) or (img[i+1, j+1] == strong)
                        or (img[i, j-1] == strong) or (img[i, j+1] == strong)
                        or (img[i-1, j-1] == strong) or (img[i-1, j] == strong) or (img[i-1, j+1] == strong)):
                        img[i, j] = strong
                    else:
                        img[i, j] = 0
                except IndexError as e:
                    pass
    
    return img

5. 边缘检测算法比较

算法	优点	缺点	适用场景
Sobel	计算简单，对噪声有一定抑制作用	边缘较粗，定位不够精确	实时应用，对精度要求不高的场景
Canny	检测精度高，边缘连续性好	计算复杂，参数敏感	高精度边缘检测需求
Laplacian	能检测到细小边缘	对噪声敏感	需要检测细节特征的场景
Prewitt	计算简单，各向同性	对噪声敏感，边缘较粗	简单的边缘检测任务