当前位置：首页 > news >正文

OpenCV 实战：多角度模板匹配（旋转不变性实现）

news 2026/5/11 20:34:52

引言

在图像处理中，模板匹配是一项基础且重要的技术。通过模板匹配，我们可以在目标图像中寻找与给定模板最相似的区域。然而，标准的模板匹配方法对目标的旋转、缩放等变换非常敏感。当待检测对象在图像中发生了角度变化时，匹配效果会显著下降。本文将基于一个具体的例子——在一张包含多个对象的图片中，匹配一个可能发生了旋转的模板图像，来详细介绍如何通过生成模板的多个旋转版本，实现多角度模板匹配。代码将逐步解释每个环节，并重点剖析cv2.rotate和np.where的配合使用，以实现旋转不变性的目标检测。

环境与依赖

Python 3.x
OpenCV（cv2）
NumPy（np）

任务描述

给定一张待搜索的大图image.jpg和一个模板图像tem.jpg。image.jpg中可能包含与模板内容相似但方向不同的多个对象。要求在同一窗口内依次完成：

使用原始模板进行匹配，标记出相似度超过阈值（0.9）的区域；
使用顺时针旋转90度的模板进行匹配，并标记新找到的区域；
使用逆时针旋转90度的模板进行匹配，并标记新找到的区域。

最终效果图应能显示所有匹配到的对象，并用红色矩形框标记。

原图 (image.jpg) 如下：

模板 (tem.jpg) 如下：

最终效果示意如下：

实现步骤详解

1. 读取图像

import cv2 import numpy as np img_rgb = cv2.imread("image.jpg")

使用cv2.imread读取待搜索的彩色图片，返回一个BGR格式的NumPy数组，用于最后的彩色绘制。

2. 图像预处理

模板匹配通常在灰度图上进行，以提高计算效率并减少色彩干扰。

img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY) template = cv2.imread("tem.jpg", 0) # 0 表示以灰度模式读取 h, w = template.shape[:2] # 获取模板的原始高度和宽度

cv2.cvtColor将彩色图转换为灰度图。
模板tem.jpg也以灰度模式读取，确保与目标图像的格式一致。
获取原始模板的尺寸h, w，后续绘制矩形框时会用到。

3. 生成旋转模板

为解决旋转问题，我们创建模板的多个旋转版本。

templates = [ template, # 原始模板 cv2.rotate(template, cv2.ROTATE_90_CLOCKWISE), # 顺时针旋转90度 cv2.rotate(template, cv2.ROTATE_90_COUNTERCLOCKWISE), # 逆时针旋转90度 ]

cv2.rotate是OpenCV提供的图像旋转函数，通过指定旋转码（cv2.ROTATE_90_CLOCKWISE等）可以快速实现90度、180度、270度的旋转。
这里我们构建了一个包含三个模板的列表，后续将遍历这个列表进行匹配。

4. 模板匹配与阈值筛选

遍历每个模板，在灰度图上进行匹配，并筛选出高相似度的区域。

for template in templates: # 模板匹配，使用归一化相关系数法 res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED) threshold = 0.9 # 设置阈值，只有大于0.9的匹配点才被接受 loc = np.where(res >= threshold) # 返回满足条件的坐标 print(loc) # 打印坐标数组，便于观察

cv2.matchTemplate在目标图像上滑动模板，计算每个位置的相似度。cv2.TM_CCOEFF_NORMED方法返回一个范围在[-1, 1]的浮点矩阵，值越接近1表示越相似。
threshold = 0.9设定了严格的筛选条件。
np.where(res >= threshold)返回一个元组，包含两个数组：第一个数组是行坐标（y），第二个数组是列坐标（x）。这正是所有匹配点左上角的坐标。

5. 坐标转换与绘制矩形框

将筛选出的坐标转换为适合绘制的格式，并在彩色图像上绘制矩形框。

# 绘制矩形框 for pt in zip(*loc[::-1]): # loc[::-1]将行列坐标转换为(x, y)顺序 cv2.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (0, 0, 255), 2)

关键点解析：loc返回的是(y, x)形式的坐标，而cv2.rectangle需要(x, y)形式的左上角坐标。loc[::-1]将元组的顺序反转，变为(x, y)。zip(*...)则将反转后的两个数组打包成一个个点坐标(x, y)。
cv2.rectangle在彩色图img_rgb上绘制矩形，矩形左上角为pt，右下角为(pt[0] + w, pt[1] + h)，颜色为红色(0, 0, 255)，线宽为2。

6. 显示结果

每匹配完一个模板后，显示当前已绘制所有匹配框的图像。

cv2.imshow("image", img_rgb) cv2.waitKey(0) cv2.destroyAllWindows()

cv2.imshow弹出窗口显示图像。
cv2.waitKey(0)等待用户按键，按下后继续执行下一个模板的匹配和绘制。
最后用cv2.destroyAllWindows()关闭所有窗口。

完整代码

整合以上步骤，得到完整脚本：

import cv2 import numpy as np # 1. 读取图像 img_rgb = cv2.imread("image.jpg") img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY) # 2. 读取模板 template = cv2.imread("tem.jpg", 0) h, w = template.shape[:2] # 3. 生成旋转模板列表 templates = [ template, cv2.rotate(template, cv2.ROTATE_90_CLOCKWISE), cv2.rotate(template, cv2.ROTATE_90_COUNTERCLOCKWISE), ] # 4. 遍历每个模板进行匹配和绘制 for template in templates: res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED) threshold = 0.9 loc = np.where(res >= threshold) print(loc) # 打印坐标以便观察 # 绘制找到的矩形框 for pt in zip(*loc[::-1]): cv2.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (0, 0, 255), 2) # 显示当前结果 cv2.imshow("image", img_rgb) cv2.waitKey(0) cv2.destroyAllWindows()

关键点解析

1.`cv2.rotate`旋转模板

本例中我们只考虑了90度倍数的旋转。cv2.rotate提供了三种旋转码：ROTATE_90_CLOCKWISE、ROTATE_180、ROTATE_90_COUNTERCLOCKWISE。如果实际应用场景中对象可能以任意角度出现，需要编写更通用的旋转函数，使用cv2.getRotationMatrix2D和cv2.warpAffine，并指定角度步长（如每15度）。但需注意，任意角度旋转后，模板的空白区域通常用黑色填充，这可能影响匹配结果。

2.`cv2.matchTemplate`的方法选择

本例使用cv2.TM_CCOEFF_NORMED，它是归一化的相关系数匹配法，对光照变化有一定的鲁棒性，且结果范围固定，便于设置统一的阈值。其他方法如TM_SQDIFF（平方差匹配）也可以使用，但其结果是差异值，需要寻找最小值，且阈值设定方式不同。

3.`np.where(res >= threshold)`的返回值

np.where返回一个元组，其长度等于输入数组的维度。对于二维的res矩阵，返回(array(rows), array(cols))。理解这一点对正确进行坐标转换至关重要。许多初学者容易混淆行列与笛卡尔坐标的顺序，导致绘制错误。

4. 矩形框尺寸的潜在问题

代码中绘制矩形框时使用了原始模板的宽高(w, h)。这是一个需要注意的细节：当模板旋转90度后，其实际宽高会互换（原来的高度变成宽度，原来的宽度变成高度）。如果仍使用原始尺寸绘制，矩形框的大小可能不正确。优化方案是在循环内部获取当前模板的尺寸：

for template in templates: h_cur, w_cur = template.shape[:2] # 获取当前模板的实际宽高 # ... 匹配和绘制逻辑 ... for pt in zip(*loc[::-1]): cv2.rectangle(img_rgb, pt, (pt[0] + w_cur, pt[1] + h_cur), (0, 0, 255), 2)

5. 窗口显示管理

cv2.waitKey(0)使窗口保持显示，直到用户按下任意键。如果希望自动延时关闭，可以传入非0的毫秒数，例如cv2.waitKey(1000)表示显示1秒后自动关闭。注意不要在显示前调用cv2.destroyAllWindows()，否则窗口会立即关闭。

运行结果与讨论

运行代码后，将依次弹出三个窗口：

第一个窗口：显示使用原始模板匹配到的结果。控制台会打印一个坐标，例如[433], dtype=int64和151], dtype=int64，表示找到一个匹配点，其坐标为(151, 433)。
第二个窗口：按下任意键后，显示加入了顺时针90度模板匹配结果的图像。控制台可能打印出多个坐标，表示找到了多个匹配区域。
第三个窗口：再按一次键，显示加入了逆时针90度模板匹配结果的最终图像。控制台会打印第三组坐标。

最终图像上将用红色矩形框标记出所有与任一模板相似度超过0.9的区域。通过观察不同模板找到的矩形框位置，可以验证多角度匹配的效果。

通过调整threshold的值（例如降低到0.8），可以观察到更多候选区域，但也可能引入误检。实际应用中需根据图像质量和需求进行权衡。