【OCR 学习笔记】二值化——全局阈值方法

垚武田

已于 2024-08-15 11:09:00 修改

阅读量1.2k

点赞数 7

分类专栏： OCR 文章标签： ocr 学习笔记

于 2024-08-14 18:10:44 首次发布

本文链接：https://blog.youkuaiyun.com/TeamLee/article/details/141180534

版权

二值化——全局阈值方法

固定阈值方法
Otsu算法
在OpenCV中的实现
- 固定阈值
- Otsu算法

图像二值化（Image Binarization）是指将像素点的灰度值设为0或255，使图像呈现明显的黑白效果。二值化一方面减少了数据维度，另一方面通过排除原图中噪声带来的干扰，可以凸显有效区域的轮廓结构。OCR效果很大程度上取决于该步骤，高质量的二值图像可以显著提升识别的准确率。目前，二值化的方法主要分为全局阈值方法（Global Binarization）、局部阈值方法（Local Binarization）、基于深度学习的方法和其他方法。

固定阈值方法

该方法对输入图像中的所有像素点统一使用同一个固定阈值。其算法如下：
$g(x,y)=\begin{cases} 255, & 若f(x,y)\geq T \\ 0, & 否则 \end{cases}$

$T$ 为全局阈值

不同的阈值 $T$ 会产生不同的二值化效果。对于不同的输入图像，最佳的阈值 $T$ 也不一样，这也是固定阈值方法的主要缺陷。
于是，解决这一缺陷的相应算法也随之而出现；下面的几种方法均采用了根据输入图像计算最佳阈值的思想。

Otsu算法

Ostu算法¹又称最大类间方差法，由日本学者Nobuyuki Ostu于1979年提出，是一种在自适应的阈值确定方法。
Ostu算法将输入图像分为 $L$ 个灰度级， $n_i$ 表示灰度级为 $i$ 的像素个数，则像素总数 $N=n_1+n_2+ \cdots +n_L$ 。为了简化讨论，这里使用归一化的灰度直方图，并将其视为输入图像的概率分布：
$p_i=n_i/N, p_i>0, \sum_{i=1}^{L}p_i=1$
现假设在第 $k$ 个灰度级设置阈值，将图像分为 $C_0$ 和 $C_1$ （背景和目标物体）， $C_0$ 表示灰度级为 $\cdots, k]$ 的像素点， $C_1$ 表示灰度级为 $\cdots, L]$ 的像素点，那么两类出现的概率以及类内灰度级的均值分别为：

最低0.47元/天解锁文章