【python】OpenCV—Template Matching

在这里插入图片描述


更多有趣的代码示例,可参考【Programming】


1、功能描述

基于 opencv-python 实现模板匹配算法

在这里插入图片描述

2、原理分析

算法流程

(1)滑动窗口

将模板图像在目标图像上逐点滑动。

对于每个位置,计算模板与当前窗口区域的相似度。

(2)相似度计算

使用特定的匹配方法计算模板与当前窗口区域的相似度。

常用的匹配方法包括相关性、平方差等。

(3)结果矩阵

将每个位置的相似度值存储在结果矩阵中。

结果矩阵的大小为 (W - w + 1, H - h + 1),其中 W 和 H 是目标图像的宽和高,w 和 h 是模板图像的宽和高。

(4)最佳匹配定位

根据匹配方法,找到结果矩阵中的最大值或最小值位置。

该位置即为模板在目标图像中的最佳匹配位置。

优点

  • 实现简单,计算直观。
  • 适用于模板与目标图像具有明显相似性的场景。

缺点

  • 计算量大,对于大图像或高分辨率图像,性能较差。
  • 对尺度、旋转、光照变化敏感。
  • 可能产生多个误匹配,需要后续处理。

应用场景

  • 图像识别:在图像中定位特定对象或标志。
  • 目标检测:检测图像中的特定模式或形状。
  • 工业检测:在生产线中检测产品缺陷或特定部件。
  • 视频跟踪:在视频序列中跟踪特定对象。

改进与优化

  • 多尺度匹配:结合图像金字塔技术,在不同尺度下进行模板匹配。
  • 特征匹配:使用特征点(如 SIFT、SURF)进行匹配,提高鲁棒性。
  • 快速算法:使用快速傅里叶变换(FFT)加速相关性计算。
  • 后处理:对匹配结果进行非极大值抑制(NMS),减少误匹配。

3、代码实现

导入必要的库函数

import cv2
import time
import numpy as np

读入目标图像(Input Image),转换为灰度图,读入模板图像(Template Image),以灰度图模式读取

配置匹配置信度相关参数

img_rgb = cv2.imread('1.jpg')  # 需要检测的图片
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)  # 转化成灰色
template_img = cv2.imread('4.jpg', 0)  # 模板小图
template_threshold = 0.8  # 模板置信度

调用模板匹配算法

dets = template(img_gray, template_img, template_threshold)

可视化结果,并将结果保存

    for coord in dets:
        cv2.rectangle(img_rgb, (int(coord[0]), int(coord[1])), (int(coord[2]), int(coord[3])), (0, 0, 255), 2)
    cv2.imwrite("result4.jpg", img_rgb)

下面看看 template 函数的实现

def template(img_gray, template_img, template_threshold, nms=False):
    '''
    img_gray:待检测的灰度图片格式
    template_img:模板小图,也是灰度化了
    template_threshold:模板匹配的置信度
    '''

    h, w = template_img.shape[:2]
    res = cv2.matchTemplate(img_gray, template_img, cv2.TM_CCOEFF_NORMED)
    start_time = time.time()
    loc = np.where(res >= template_threshold)  # 大于模板阈值的目标坐标
    score = res[res >= template_threshold]  # 大于模板阈值的目标置信度
    # 将模板数据坐标进行处理成左上角、右下角的格式
    xmin = np.array(loc[1])
    ymin = np.array(loc[0])
    xmax = xmin + w
    ymax = ymin + h
    xmin = xmin.reshape(-1, 1)  # 变成n行1列维度
    xmax = xmax.reshape(-1, 1)  # 变成n行1列维度
    ymax = ymax.reshape(-1, 1)  # 变成n行1列维度
    ymin = ymin.reshape(-1, 1)  # 变成n行1列维度
    score = score.reshape(-1, 1)  # 变成n行1列维度
    data_hlist = []
    data_hlist.append(xmin)
    data_hlist.append(ymin)
    data_hlist.append(xmax)
    data_hlist.append(ymax)
    data_hlist.append(score)
    data_hstack = np.hstack(data_hlist)  # 将xmin、ymin、xmax、yamx、scores按照列进行拼接
    thresh = 0.3  # NMS里面的IOU交互比阈值

    if nms:
        keep_dets = py_nms(data_hstack, thresh)  # (203, 5)
    else:
        keep_dets = list(range(data_hstack.shape[0]))
    print("nms time:", time.time() - start_time)  # 打印数据处理到nms运行时间
    dets = data_hstack[keep_dets]  # 最终的nms获得的矩形框
    return dets

核心算法是调用了 res = cv2.matchTemplate(img_gray, template_img, cv2.TM_CCOEFF_NORMED)

把返回的结果改变下格式保存

经过 keep_dets = py_nms(data_hstack, thresh) 非极大值抑制算法后,输出最终的模板匹配结果

nms 的实现如下

def py_nms(dets, thresh):
    """Pure Python NMS baseline."""
    # x1、y1、x2、y2、以及score赋值
    # (x1、y1)(x2、y2)为box的左上和右下角标
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]
    # 每一个候选框的面积
    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    # order是按照score降序排序的
    order = scores.argsort()[::-1]
    # print("order:",order)

    keep = []
    while order.size > 0:
        i = order[0]
        keep.append(i)
        # 计算当前概率最大矩形框与其他矩形框的相交框的坐标,会用到numpy的broadcast机制,得到的是向量
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])
        # 计算相交框的面积,注意矩形框不相交时w或h算出来会是负数,用0代替
        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        # 计算重叠度IOU:重叠面积/(面积1+面积2-重叠面积)
        ovr = inter / (areas[i] + areas[order[1:]] - inter)
        # 找到重叠度不高于阈值的矩形框索引
        inds = np.where(ovr <= thresh)[0]
        # print("inds:",inds)
        # 将order序列更新,由于前面得到的矩形框索引要比矩形框在原order序列中的索引小1,所以要把这个1加回来
        order = order[inds + 1]
    return keep

4、效果展示

输入图片

在这里插入图片描述

模板1

在这里插入图片描述
结果

在这里插入图片描述
模板2

在这里插入图片描述

结果
在这里插入图片描述

模板3

在这里插入图片描述

结果

在这里插入图片描述

输入图片

在这里插入图片描述
模板

在这里插入图片描述

输出结果

在这里插入图片描述

变成灰度图匹配的缺点,哈哈,石头草堆也都错误匹配了

输入图片,阈值 0.6

在这里插入图片描述

模板1

在这里插入图片描述

结果

在这里插入图片描述

这就是没有角度鲁棒性的缺点

模板

在这里插入图片描述

结果

在这里插入图片描述
模板

在这里插入图片描述

结果

在这里插入图片描述
阈值设置的低 0.6,不管炮口的朝向了

5、完整代码

import cv2
import time
import numpy as np


def py_nms(dets, thresh):
    """Pure Python NMS baseline."""
    # x1、y1、x2、y2、以及score赋值
    # (x1、y1)(x2、y2)为box的左上和右下角标
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]
    # 每一个候选框的面积
    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    # order是按照score降序排序的
    order = scores.argsort()[::-1]
    # print("order:",order)

    keep = []
    while order.size > 0:
        i = order[0]
        keep.append(i)
        # 计算当前概率最大矩形框与其他矩形框的相交框的坐标,会用到numpy的broadcast机制,得到的是向量
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])
        # 计算相交框的面积,注意矩形框不相交时w或h算出来会是负数,用0代替
        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        # 计算重叠度IOU:重叠面积/(面积1+面积2-重叠面积)
        ovr = inter / (areas[i] + areas[order[1:]] - inter)
        # 找到重叠度不高于阈值的矩形框索引
        inds = np.where(ovr <= thresh)[0]
        # print("inds:",inds)
        # 将order序列更新,由于前面得到的矩形框索引要比矩形框在原order序列中的索引小1,所以要把这个1加回来
        order = order[inds + 1]
    return keep


def template(img_gray, template_img, template_threshold, nms=False):
    '''
    img_gray:待检测的灰度图片格式
    template_img:模板小图,也是灰度化了
    template_threshold:模板匹配的置信度
    '''

    h, w = template_img.shape[:2]
    res = cv2.matchTemplate(img_gray, template_img, cv2.TM_CCOEFF_NORMED)
    start_time = time.time()
    loc = np.where(res >= template_threshold)  # 大于模板阈值的目标坐标
    score = res[res >= template_threshold]  # 大于模板阈值的目标置信度
    # 将模板数据坐标进行处理成左上角、右下角的格式
    xmin = np.array(loc[1])
    ymin = np.array(loc[0])
    xmax = xmin + w
    ymax = ymin + h
    xmin = xmin.reshape(-1, 1)  # 变成n行1列维度
    xmax = xmax.reshape(-1, 1)  # 变成n行1列维度
    ymax = ymax.reshape(-1, 1)  # 变成n行1列维度
    ymin = ymin.reshape(-1, 1)  # 变成n行1列维度
    score = score.reshape(-1, 1)  # 变成n行1列维度
    data_hlist = []
    data_hlist.append(xmin)
    data_hlist.append(ymin)
    data_hlist.append(xmax)
    data_hlist.append(ymax)
    data_hlist.append(score)
    data_hstack = np.hstack(data_hlist)  # 将xmin、ymin、xmax、yamx、scores按照列进行拼接
    thresh = 0.3  # NMS里面的IOU交互比阈值

    if nms:
        keep_dets = py_nms(data_hstack, thresh)  # (203, 5)
    else:
        keep_dets = list(range(data_hstack.shape[0]))
    print("nms time:", time.time() - start_time)  # 打印数据处理到nms运行时间
    dets = data_hstack[keep_dets]  # 最终的nms获得的矩形框
    return dets


if __name__ == "__main__":
    img_rgb = cv2.imread('1.jpg')  # 需要检测的图片
    img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)  # 转化成灰色
    template_img = cv2.imread('4.jpg', 0)  # 模板小图
    template_threshold = 0.8  # 模板置信度
    dets = template(img_gray, template_img, template_threshold)
    for coord in dets:
        cv2.rectangle(img_rgb, (int(coord[0]), int(coord[1])), (int(coord[2]), int(coord[3])), (0, 0, 255), 2)
    cv2.imwrite("result4.jpg", img_rgb)

6、涉及到的库函数

cv2.matchTemplate

函数签名

cv2.matchTemplate(image, templ, method[, result[, mask]]) -> result

参数说明

image:

  • 类型:numpy.ndarray
  • 输入图像,在其中搜索模板。

templ:

  • 类型:numpy.ndarray
  • 模板图像,即要搜索的小图像。

method:

  • 类型:int
  • 用于计算匹配度的方法。常用的方法包括:
    • cv2.TM_CCOEFF
    • cv2.TM_CCOEFF_NORMED
    • cv2.TM_CCORR
    • cv2.TM_CCORR_NORMED
    • cv2.TM_SQDIFF
    • cv2.TM_SQDIFF_NORMED

result:

  • 类型:numpy.ndarray(可选)
  • 输出结果矩阵,存储匹配结果。

mask:

  • 类型:numpy.ndarray(可选)
  • 掩码图像,用于指定模板中哪些部分需要考虑。

返回值
result:

  • 类型:numpy.ndarray
  • 匹配结果矩阵,其大小为 (W - w + 1, H - h + 1),其中 W 和 H 是输入图像的宽和高,w 和 h 是模板图像的宽和高。
    每个元素表示模板在对应位置的匹配度。

7、参考


更多有趣的代码示例,可参考【Programming】

### 使用 PythonOpenCV 进行模板匹配 模板匹配是一种用于在较大图像中查找较小子图像位置的技术。以下是实现此功能的一个简单例子: #### 导入必要的库 为了执行模板匹配操作,需要导入 `cv2` 库以及 NumPy 来处理数组。 ```python import cv2 import numpy as np from matplotlib import pyplot as plt ``` #### 加载图像和模板 加载目标图像和要匹配的模板图片,并将其转换为灰度图以便于计算[^1]。 ```python img_rgb = cv2.imread('mario.png') # 主图像 template = cv2.imread('coin.png', 0) # 要寻找的小模板 h, w = template.shape[:2] # 获取模板的高度和宽度 gray_img = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY) ``` #### 执行模板匹配 通过调用 `matchTemplate()` 函数来完成实际的匹配过程。这里使用的是平方差方法 (TM_SQDIFF),其他可用的方法包括 TM_CCORR_NORMED 或者 TM_CCOEFF_NORMED 等等。 ```python res = cv2.matchTemplate(gray_img, template, cv2.TM_SQDIFF) min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res) top_left = min_loc # 对于 TM_SQDIFF 方法来说是最小值的位置 bottom_right = (top_left[0] + w, top_left[1] + h) cv2.rectangle(img_rgb, top_left, bottom_right, (0, 0, 255), 2) # 绘制矩形框标记检测到的对象 plt.subplot(121), plt.imshow(res, cmap='gray') plt.title('Matching Result'), plt.xticks([]), plt.yticks([]) plt.subplot(122), plt.imshow(cv2.cvtColor(img_rgb, cv2.COLOR_BGR2RGB)) plt.title('Detected Point'), plt.xticks([]), plt.yticks([]) plt.show() ``` 上述代码展示了如何利用 OpenCV 的函数来进行基本的模板匹配并可视化结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值