文章目录
模板匹配得概念介绍
- 模板匹配和卷积原理很像,模板在原图像上从原点开始滑动,计算模板与(图像被模板覆盖的地方)的差别程度,这个差别程度的计算方法在opencv里有6种,然后将每次计算的结果放入一个矩阵里,作为结果输出。假如原图形是AxB大小,而模板是axb大小,则输出结果的矩阵是(A-a+1)x(B-b+1)。
- 举个例子,我们对Lena的脸部进行模板匹配,如下图所示:
#相关代码
img = cv2.imread('lena.jpg', 0)
template = cv2.imread('face.jpg', 0)
h, w = template.shape[:2]
#输出图形大小
img.shape
(263, 263)
template.shape
(110, 85)
模板匹配的几种常见算法
-
TM_SQDIFF:计算平方不同,计算出来的值越小,越相关。
-
TM_CCORR:计算相关性,计算出来的值越大,越相关。
-
TM_CCOEFF:计算相关系数,计算出来的值越大,越相关
-
TM_SQDIFF_NORMED:计算归一化平方不同,计算出来的值越接近0,越相关。
-
TM_CCORR_NORMED:计算归一化相关性,计算出来的值越接近1,越相关。
-
TM_CCOEFF_NORMED:计算归一化相关系数,计算出来的值越接近1,越相关。
- 紧接上一节的那个小demo,我们先指定一个method的列表,然后使用模板匹配函数。
methods = ['cv2.TM_CCOEFF', 'cv2.TM_CCOEFF_NORMED', 'cv2.TM_CCORR',
'cv2.TM_CCORR_NORMED', 'cv2.TM_SQDIFF', 'cv2.TM_SQDIFF_NORMED']
res = cv2.matchTemplate(img, template, cv2.TM_SQDIFF)
res.shape
(154, 179)
- 因为通过滑动窗口的匹配过程非常麻烦,所以这里OpenCV提供cv2.minMaxLoc()函数,输入计算出的矩阵大小直接返回出四个值,代码如下:
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
#最小值
min_val
39168.0
#最大值
max_val
74403584.0
#最小值坐标位置
min_loc
(107, 89)
#最大值坐标位置
max_loc
(159, 62)
- 这些取值的用法在于之间选用的模板,例如选择cv2.TM_SQDIFF这种方法,根据之前官网上的定义:值越小,越相关。故最终我们使用min_loc这个值。
- 总结:再做模板匹配的时候,我们尽量使用归一化的方法。例如:cv2.TM_SQDIFF_NORMED,cv2.TM_CCOEFF_NORMED等。
匹配效果展示
匹配一个对象
- 相关代码展示:
import cv2 #opencv读取的格式是BGR
import numpy as np
import matplotlib.pyplot as plt#Matplotlib是RGB
%matplotlib inline
methods = ['cv2.TM_CCOEFF', 'cv2.TM_CCOEFF_NORMED', 'cv2.TM_CCORR',
'cv2.TM_CCORR_NORMED', 'cv2.TM_SQDIFF', 'cv2.TM_SQDIFF_NORMED']
for meth in methods:
img2 = img.copy()
# 匹配方法的真值
method = eval(meth)
print (method)
res = cv2.matchTemplate(img, template, method)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
# 如果是平方差匹配TM_SQDIFF或归一化平方差匹配TM_SQDIFF_NORMED,取最小值
if method in [cv2.TM_SQDIFF, cv2.TM_SQDIFF_NORMED]:
top_left = min_loc
else:
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
# 画矩形
cv2.rectangle(img2, top_left, bottom_right, 255, 2)
plt.subplot(121), plt.imshow(res, cmap='gray')
plt.xticks([]), plt.yticks([]) # 隐藏坐标轴
plt.subplot(122), plt.imshow(img2, cmap='gray')
plt.xticks([]), plt.yticks([])
plt.suptitle(meth)
plt.show()
- 显示结果
- 总结:凡是带归一化的,匹配效果都相当不错。
匹配多个对象
- 相关代码展示
#这个是马里奥金币匹配的代码块
img_rgb = cv2.imread('mario.jpg')
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
template = cv2.imread('mario_coin.jpg', 0)
h, w = template.shape[:2]
res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED)
#匹配多个对象时需要设置一个阈值
threshold = 0.8
# 取匹配程度大于%80的坐标,np.where寻找坐标
loc = np.where(res >= threshold)
for pt in zip(*loc[::-1]): # *号表示可选参数
bottom_right = (pt[0] + w, pt[1] + h)
cv2.rectangle(img_rgb, pt, bottom_right, (0, 0, 255), 2)
cv2.imshow('img_rgb', img_rgb)
cv2.waitKey(0)
- 效果展示图: