图像阈值分割_opencv实现otsu分割算法 python-优快云博客

本文链接：https://blog.youkuaiyun.com/SinkAboutIt/article/details/148409682

本实验报告深入探讨了数字图像处理中几种重要的阈值分割技术，包括人工阈值、迭代阈值、直方图双峰谷值法、最大类间方差法（Otsu）和自适应阈值分割。通过Python和OpenCV库，我们实现了这些算法，并通过Matplotlib进行可视化展示。此外，报告还详细分析了一个基于PyQt5开发的交互式图像处理GUI工具，该工具集成了上述阈值分割功能以及多种图像效果滤镜（如高斯模糊、中值滤波、锐化、直方图均衡化、噪声添加等），旨在提供一个直观、高效的图像处理与分析平台。实验旨在加深对各种阈值分割原理的理解，并展示桌面应用开发在图像处理领域的实际应用。

1. 引言

图像分割是数字图像处理中的一个核心任务，旨在将图像划分为具有特定意义或相同属性的区域。阈值分割作为最简单、最常用的一种图像分割技术，因其计算简单、效率高而被广泛应用于二值化图像、目标检测、模式识别等领域。然而，单一的全局阈值分割在面对光照不均、背景复杂等情况时往往表现不佳，因此发展出了多种高级阈值分割方法。

本实验将通过Python语言，结合OpenCV和NumPy库，实现并分析多种经典的阈值分割算法，包括：

人工阈值分割：最直接的全局阈值设置。
迭代阈值分割：基于灰度均值的自适应全局阈值。
直方图阈值分割：利用图像灰度直方图的特性寻找最佳阈值。
最大类间方差法（Otsu）：一种经典的全局自适应阈值方法，旨在最大化前景和背景的方差。
自适应阈值分割：针对光照不均情况，在图像局部区域计算阈值。

此外，为了提供更直观、更灵活的操作体验，我们还开发了一个基于PyQt5的交互式图像处理GUI应用，该应用不仅包含了上述阈值分割功能，还集成了多种图像增强和滤镜效果，并利用多线程技术确保UI的响应性。

2. 实验目的

掌握不同阈值分割算法的基本原理和适用场景。
通过Python和OpenCV实现各种阈值分割算法。
对比分析不同阈值分割算法的效果和局限性。
了解并实践基于PyQt5的图像处理桌面应用开发，包括UI布局、事件处理、多线程并发处理图像。
熟悉OpenCV中常用的图像处理函数，如滤波、锐化、噪声添加等。

3. 实验原理

3.1 阈值分割基础

阈值分割是最基本的图像分割方法之一。其核心思想是设定一个阈值 T，将图像中灰度值大于等于 T 的像素设为一个值（如255，白色），而将小于 T 的像素设为另一个值（如0，黑色），从而将图像二值化，形成前景和背景。

3.2 人工阈值分割 (Manual Thresholding)

原理：直接指定一个固定灰度值作为阈值。
优点：简单直观。
缺点：对图像内容和光照变化非常敏感，需要人工经验确定，缺乏通用性。

3.3 迭代阈值分割 (Iterative Thresholding)

原理：这是一种自适应的全局阈值方法。

初始阈值 T：通常取图像的平均灰度值。
分割图像：将图像像素根据 T 分为两组：前景（灰度值 ≥ T）和背景（灰度值 < T）。
计算新阈值：分别计算前景和背景像素的平均灰度值 m1 和 m2。将新的阈值 T_new = (m1 + m2) / 2。
收敛判断：如果 $|T_{new} - T|$ 小于某个预设的小值（或 $T_{new}$ 不再变化），则算法收敛， $T_{new}$ 为最终阈值。否则，将 $T_{new}$ 作为新的 T，重复步骤2。
优点：自动化程度高，适用于具有清晰双峰直方图的图像。
缺点：收敛速度和结果可能受初始阈值和收敛条件影响，不适用于非双峰直方图或光照不均图像。

3.4 直方图阈值分割 (Histogram Thresholding - Peak-Valley Method)

原理：基于图像灰度直方图的特征。对于具有明显双峰的直方图（代表前景和背景），通常在两峰之间的谷底寻找最佳阈值。
本实验代码中实现的策略是：

找到直方图中的全局最大峰值 f1。
在剩余的灰度级中，寻找一个灰度级 f2，使得 $(i - f1)^2 * n[i]$ 最大，这可以近似为寻找远离 f1 且像素数量相对较大的第二个“峰”。
在 f1 和 f2 之间（通常是较小的那个峰到较大的那个峰的区间），寻找像素数最少的灰度级，即谷底，将其作为阈值 T。
优点：在直方图有明显双峰的情况下效果良好。
缺点：对噪声敏感，如果直方图没有清晰的双峰或有多个峰，可能失效。代码中寻找第二个峰的方法并非严格意义上的峰值检测，而是基于距离和数量的加权，可能需要调整。

3.5 最大类间方差法 (Otsu's Method)

原理：自动确定最佳全局阈值。它遍历所有可能的阈值 T，计算前景和背景的类间方差，选取使类间方差最大的 T 作为最终阈值。

优点：算法稳定，计算效率高，是图像二值化中最常用的自适应阈值方法之一。OpenCV内置了此算法。
缺点：当图像直方图不是明显的双峰时（如单峰或多峰），效果可能不佳。

3.6 自适应阈值分割 (Adaptive Thresholding)

原理：与全局阈值不同，自适应阈值在图像的不同区域计算不同的阈值。这对于光照不均的图像非常有效。
OpenCV提供了两种主要方法：

ADAPTIVE_THRESH_MEAN_C：阈值是该像素邻域的平均值减去一个常数 C。
ADAPTIVE_THRESH_GAUSSIAN_C：阈值是该像素邻域的加权平均值（高斯加权）减去一个常数 C。
参数：
blockSize：计算阈值的邻域大小（必须是奇数）。
C：从平均值中减去的常数。
本实验代码中自定义了一种简单的自适应方法：img_t = img_b - 0.95 * cv2.blur(img_b, (5, 5))，可以理解为局部平均背景减法，用于增强局部对比度。
优点：能够处理光照不均、背景复杂的图像。
缺点：计算量相对较大，blockSize 和 C 的选择对结果影响很大。

4. 实验步骤与代码分析

4.1 单独阈值分割脚本分析

以下对各脚本的关键代码进行分析，并展示其效果。

4.1.1 人工阈值分割.py

原理简述：通过手动设置一个固定阈值来二值化图像。同时，它还展示了图像的灰度直方图。

代码分析：

import cv2
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置中文字体

img = cv2.imread('001.bmp', 0) # 读取灰度图像

# 使用固定阈值150进行二值化
_, img_b = cv2.threshold(img, 150, 255, cv2.THRESH_BINARY)

# 图像显示
plt.subplot(131); plt.imshow(img, 'gray'); plt.title('原图'); plt.axis('off')
plt.subplot(132)
hist = cv2.calcHist([img], [0], None, [256], [0, 255]) # 计算直方图
plt.plot(hist); plt.title('灰度直方图')
plt.subplot(133); plt.imshow(img_b, 'gray'); plt.title('人工阈值分割图 T=150'); plt.axis('off')
plt.show()

效果展示：

分析：对于对比度明显且光照均匀的图像，人工阈值分割能够快速实现二值化。但若图像复杂，则难以找到合适的单一阈值，且缺乏自动化能力。直方图的展示有助于我们理解图像的灰度分布，为手动选择阈值提供依据。

4.1.2 迭代阈值分割.py

原理简述：通过迭代计算前景和背景的平均灰度值来更新阈值，直到阈值收敛。

代码分析：

import cv2
import numpy as np
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']

img = cv2.imread('001.bmp', 0)
T = int(np.mean(img)) # 初始阈值取图像平均灰度

# 迭代计算最佳阈值
while True:
    m1 = np.mean(img[img >= T]) # 大于等于T的像素平均值
    m2 = np.mean(img[img < T]) # 小于T的像素平均值
    new_T = int((m1 + m2) / 2) # 更新阈值
    if abs(new_T - T) < 20: # 收敛条件：新旧阈值差小于20
        break
    else:
        T = new_T

# 使用计算得到的阈值进行二值化
_, img_b = cv2.threshold(img, T, 255, cv2.THRESH_BINARY)

# 图像显示
plt.subplot(121); plt.imshow(img, 'gray'); plt.title('原图'); plt.axis('off')
plt.subplot(122); plt.imshow(img_b, 'gray'); plt.title(f'迭代阈值分割图 T={T}.'); plt.axis('off')
plt.show()

效果展示：

分析：迭代阈值分割在一定程度上实现了阈值选择的自动化。通过不断调整阈值，使得前景和背景的灰度分布更加分离，从而找到一个相对优化的全局阈值。其效果优于人工阈值，但在图像对比度低或噪声大的情况下，收敛性和效果可能受影响。

4.1.3 直方图阈值分割.py

原理简述：尝试通过直方图的峰值和谷值来确定阈值。先找到第一个峰值，再通过一个加权距离找到第二个“显著”峰值，最后在两峰之间寻找谷值作为阈值。

代码分析：

import cv2
import matplotlib.pyplot as plt
import numpy as np
plt.rcParams['font.sans-serif'] = ['SimHei']

img = cv2.imread('001.bmp', 0)
n, _, _ = plt.hist(img.ravel(), 256, [0, 255]) # 获取直方图数据 (n是像素数量)

l_ma = np.where(n == np.max(n))
f1 = l_ma[0][0] # 获取第一个峰值（全局最大值）的灰度值

temp = -1 # 初始化temp，确保能被第一个计算值更新
f2 = f1   # 初始化f2，防止没有找到第二个峰值

# 寻找第二个峰值：遍历所有灰度级，计算 (i - f1)^2 * n[i]
# 这种方法并非严格的峰值检测，而是寻找远离f1且像素数量较多的点
for i in range(256):
    temp1 = np.power(i - f1, 2) * n[i]
    if temp1 > temp:
        temp = temp1
        f2 = i

if f1 > f2: # 确保f1是较小的峰值
    f1, f2 = f2, f1

# 在两个峰值之间寻找谷值 (像素数最少的位置) 作为阈值
l_mi = np.where(n[f1:f2] == np.min(n[f1:f2]))
T = f1 + l_mi[0][0] # 最终阈值

# 使用计算得到的阈值进行二值化
_, img_b = cv2.threshold(img, T, 255, cv2.THRESH_BINARY)

# 图像显示
plt.subplot(121); plt.imshow(img, 'gray'); plt.title('原图'); plt.axis('off')
plt.subplot(122); plt.imshow(img_b, 'gray'); plt.title(f'直方图阈值分割图 T={T}.'); plt.axis('off')
plt.show()

注意：原始代码中的 temp 变量没有初始化，可能会导致 NameError。在分析中已添加 temp = -1 进行修正。这种寻找第二个峰值的方法可能不如直接寻找局部最大值和谷值的方法通用，但对于特定双峰分布可能有效。

效果展示：

分析：直方图双峰谷值法适用于直方图呈现明显双峰分布的图像。通过寻找前景和背景的两个聚类中心之间的“分水岭”，来确定分割阈值。该方法对直方图形态依赖性较强，对于多峰或不规则直方图可能失效。

4.1.4 最大类间方差阈值分割.py (Otsu's Method)

原理简述：通过遍历所有可能的阈值，计算并选择使前景和背景类间方差最大的阈值。同时，也展示了OpenCV内置的Otsu算法结果。

代码分析：

import cv2
import numpy as np
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']

img = cv2.imread('001.bmp', 0)

t = 0 # 初始化最大类间方差
T = 0 # 初始化最佳阈值

# 手动实现Otsu算法
for i in range(1, 255): # 遍历所有可能的灰度级作为阈值
    pixels1 = img[img < i]
    pixels2 = img[img >= i]

    if pixels1.size == 0 or pixels2.size == 0: # 避免空数组
        continue

    mean1 = np.mean(pixels1)
    mean2 = np.mean(pixels2)

    w1 = pixels1.size / img.size # 背景像素比例
    w2 = pixels2.size / img.size # 前景像素比例

    tem = w1 * w2 * np.power((mean1 - mean2), 2) # 计算类间方差

    if tem > t: # 更新最大类间方差和最佳阈值
        T = i
        t = tem

# 自定义Otsu结果
_, img_b = cv2.threshold(img, T, 255, cv2.THRESH_BINARY)

# OpenCV内置Otsu算法
T1, img_b1 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)

# 图像显示
plt.subplot(131); plt.imshow(img, 'gray'); plt.title('原图'); plt.axis('off')
plt.subplot(132); plt.imshow(img_b, 'gray'); plt.title(f'最大类间方差阈值分割图 T={T}'); plt.axis('off')
plt.subplot(133); plt.imshow(img_b1, 'gray'); plt.title(f'OTSU阈值分割图 T={int(T1)}'); plt.axis('off')
plt.show()

效果展示：

分析：Otsu算法是一种非常强大的全局自适应阈值方法。它通过最大化类间方差，使得前景和背景的区分度达到最大。手动实现与OpenCV内置函数的对比显示，两者结果通常非常接近，验证了算法的正确性。OpenCV的实现经过优化，效率更高。

4.1.5 自适应阈值分割.py

原理简述：代码中实现了两种自适应阈值方法：一种是简单的局部平均背景减法，另一种是OpenCV的adaptiveThreshold函数（高斯自适应阈值）。

代码分析：

import cv2
import numpy as np
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']

img=cv2.imread('002.bmp',0) # 使用了002.bmp，可能更适合自适应阈值

# 自定义自适应阈值方法 (局部背景减法)
img_b = img.copy()
img_p = cv2.blur(img_b, (5, 5)) # 计算局部平均背景
img_t = img_b - 0.95 * img_p # 图像减去0.95倍的局部平均背景
img_b[img_t >= 0] = 255 # 大于等于0的设为255
img_b[img_t < 0] = 0 # 小于0的设为0

# OpenCV自适应阈值 (高斯加权)
img_l = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 5, 10) # blockSize=5, C=10

# 图像显示
plt.subplot(131); plt.imshow(img,'gray'); plt.title('原图'); plt.axis('off')
plt.subplot(132); plt.imshow(img_b,'gray'); plt.title('自定义自适应阈值分割图'); plt.axis('off')
plt.subplot(133); plt.imshow(img_l,'gray'); plt.title('OpenCV自适应阈值分割图'); plt.axis('off')
plt.show()

效果展示：

分析：自适应阈值分割非常适合处理光照不均匀的图像，因为它根据图像局部区域的像素特性来确定阈值。自定义的方法是一种简单的局部对比度增强后二值化，对某些情况可能有效。OpenCV的adaptiveThreshold函数更加通用和强大，特别是高斯加权方式能更好地保留边缘细节。blockSize和C参数的调整对结果至关重要。

4.2 交互式GUI应用分析 (拖动界面.py)

整体架构：
该应用基于PyQt5框架构建，采用QMainWindow作为主窗口。UI布局主要通过QHBoxLayout和QVBoxLayout实现左右两栏布局：左侧用于显示原始图像和处理结果，右侧则包含文件操作、智能分割（阈值处理）和图像效果滤镜等控制面板。为了避免耗时的图像处理操作阻塞UI，采用了QThread进行多线程处理。

核心功能模块：

UI 布局与样式 (__init__, _apply_stylesheet)：
- 使用QHBoxLayout和QVBoxLayout组织各个控件。
- QGroupBox用于逻辑分组，提升UI的清晰度。
- QLabel用于显示图像和文本提示。
- QPushButton用于触发操作。
- QSlider用于调整参数。
- QComboBox用于选择算法类型。
- _apply_stylesheet方法定义了暗色主题的CSS样式，使界面更美观。
- 图标使用：QStyle.standardIcon被正确用于为按钮添加标准图标，增强视觉效果。
文件操作 (load_image, save_image)：
- QFileDialog.getOpenFileName和getSaveFileName实现文件选择和保存功能。
- 加载图像后，更新原始图像显示区，并禁用保存按钮（直到有处理结果）。
- 图像加载失败时，使用QMessageBox进行提示。
图像显示 (display_image)：
- 将OpenCV np.ndarray格式的图像转换为PyQt QImage和QPixmap，以便在QLabel中显示。
- 处理灰度图和彩色图的转换逻辑（Format_Grayscale8和Format_RGB888）。
- 自动缩放图像以适应QLabel大小并保持宽高比（Qt.KeepAspectRatio）。
智能分割与提取 (apply_threshold, change_threshold_type, update_threshold_param_label)：
- QComboBox让用户选择不同的阈值或边缘检测算法：普通阈值、自适应阈值、Otsu阈值、Canny边缘、HSV色彩过滤。
- QSlider根据选定的算法类型动态调整其范围和默认值（例如，自适应阈值的滑块值会转换为块大小，Canny有自己的阈值范围）。
- update_threshold_param_label实时更新滑块对应的参数值显示。
- apply_threshold方法是触发处理的核心，它会启动一个新的ProcessingThread。
图像效果滤镜 (_common_image_operation及其派生方法)：
- _common_image_operation是一个通用函数，用于处理各种图像效果。它封装了耗时操作的UI反馈（显示状态、禁用控件、显示沙漏光标）和错误处理。
- process_to_gray, blur_image, median_filter, mean_filter, laplacian_sharpen, equalize_hist, add_salt_pepper_noise, add_gaussian_noise 等方法都调用 _common_image_operation，传入对应的OpenCV函数或自定义处理逻辑。
- 拉普拉斯锐化：代码中提供了两种实现思路：直接返回拉普拉斯结果作为边缘图，或将拉普拉斯结果叠加回原图实现锐化。当前实现是第二种，将灰度图转为浮点数后减去Laplacian结果，然后裁剪并转回uint8。
- 直方图均衡化：对彩色图会先转YCrCb色彩空间，只对亮度(Y)通道进行均衡化，再转回BGR。
- 噪声添加：自定义了椒盐噪声和高斯噪声的添加逻辑，通过NumPy生成随机数并直接修改图像像素值。
多线程处理 (ProcessingThread)：
- 必要性：图像处理通常是CPU密集型操作，如果直接在主线程执行，会导致UI卡顿，影响用户体验。
- 实现：ProcessingThread继承自QThread。
  - run()方法中包含所有耗时的图像处理逻辑，例如cv2.threshold, cv2.adaptiveThreshold, cv2.Canny, cv2.inRange等。
  - finished = pyqtSignal(np.ndarray)定义了一个信号，当处理完成时，会发射处理后的图像数据到主线程。
  - 主线程中的on_processing_finished槽函数接收这个信号，并在UI上显示结果，恢复控件状态。
- 线程管理：在启动新线程前，会检查并终止旧线程，防止资源泄漏或冲突。
状态管理 (status_bar, set_controls_enabled)：
- status_bar用于显示当前操作状态和提示信息。
- set_controls_enabled辅助函数用于在处理过程中禁用或启用相关UI控件，避免用户在处理进行中进行其他操作。

GUI界面预览：

分析总结：
这个拖动界面是一个功能完备的图像处理小工具，它巧妙地结合了Python的强大图像处理库OpenCV与PyQt5的优秀UI框架。通过多线程技术，它解决了GUI应用中耗时操作阻塞UI的问题，提供了流畅的用户体验。其模块化的设计使得后续添加新的图像处理功能变得相对容易。同时，详尽的参数控制（如滑块）和算法选择（如下拉框）极大地增强了应用的交互性和灵活性。

5. 实验结果与分析总结

通过上述实验，我们对各种阈值分割算法有了更直观的理解，并观察了它们在图像二值化中的表现。

阈值分割方法	适用场景	优点	缺点
人工阈值	对比度高、光照均匀且图像内容单一	简单、直观、计算量小	需要人工经验、不具通用性、对光照敏感
迭代阈值	直方图呈双峰分布，前景背景区分明显	自动化程度高，结果相对稳定	初始值和收敛条件影响结果，不适用于多峰直方图
直方图双峰谷值	直方图呈明显双峰分布	基于图像灰度分布特性，较直观	对噪声敏感，不适用于多峰或不规则直方图
Otsu (最大类间方差)	直方图呈双峰分布，前景背景区分明显	自动化程度高，全局最优性，广泛应用	对直方图形状敏感，不适用于光照不均或多峰图像
自适应阈值	光照不均匀、图像局部对比度差异大	能够处理光照不均，鲁棒性强	计算量大，参数（blockSize, C）选择复杂