模板匹配最适用于工业场合(在一张图片中识别特定的工件图)
模板匹配是一种最原始、最基本的模式识别方法,研究某一特定对象物的图案位于图像(target)的什么地方,进而识别对象物,这就是一个匹配问题。
它是图像处理中最基本、最常用的匹配方法。模板匹配具有自身的局限性,主要表现在它只能进行平行移动,若原图像中的匹配目标发生旋转或大小变化,该算法无效。
简单来说,模板匹配就是在整个图像区域发现与给定子图像匹配的小块区域。
工作原理:在带检测图像上,从左到右,从上向下计算模板图像与重叠子图像的匹配度,匹配程度越大,两者相同的可能性越大。
import cv2 as cv
import numpy as np def matchTemplate_demo():
tpl = cv.imread('1_tpl.jpg')
target = cv.imread('1.jpg')
# cv.namedWindow('matchTemplate_demo', cv.WINDOW_AUTOSIZE)
# cv.imshow('matchTemplate_demo',tpl)
# cv.namedWindow('matchTemplate_demo', cv.WINDOW_AUTOSIZE)
cv.imshow('matchTemplate_demo', target)
#定义3中标准匹配方法
methods = [cv.TM_SQDIFF_NORMED,cv.TM_CCORR_NORMED,cv.TM_CCOEFF_NORMED]
tpl_h , tpl_w = tpl.shape[:2] #取模板图片的高 宽
for method in methods:
result = cv.matchTemplate(target,tpl,method)
#返回的 minVal, maxVal (模板与目标图片像素匹配的最小值 最大值), minLoc, maxLoc(最小和最大位置)
#打印出minVal, maxVal, minLoc, maxLoc: 0.0004309755750000477 1.0 (466, 185) (395, 327)
minVal, maxVal, minLoc, maxLoc = cv.minMaxLoc(result)
print(minVal, maxVal, minLoc, maxLoc)
if method == cv.TM_SQDIFF_NORMED:
tl = minLoc
else:
tl = maxLoc
# 当时用第一种cv.TM_SQDIFF_NORMED匹配方法时:br是矩形左上角的坐标
# 当时用第二种cv.TM_CCORR_NORMED第三种cv.TM_CCOEFF_NORMED匹配方法时:br是矩形左上角的坐标
print(tl)
br = (tl[0]+tpl_w,tl[1]+tpl_h)
#在target图片上绘制tl+br矩形,红色,线宽2
cv.rectangle(target,tl,br,(0,0,255),2)
cv.namedWindow('match-'+np.str(method),cv.WINDOW_NORMAL)
cv.imshow('match-'+np.str(method),target) matchTemplate_demo() cv.waitKey(0)
cv.destroyAllWindows()
知识点:
1.几种常见的模板匹配算法:
其中,
①TM_SQDIFF是平方差匹配;TM_SQDIFF_NORMED是标准平方差匹配。利用平方差来进行匹配,最好匹配为0,匹配越差,匹配值越大。
②TM_CCORR是相关性匹配;TM_CCORR_NORMED是标准相关性匹配。采用模板和图像间的乘法操作,数越大表示匹配程度较高, 0表示最坏的匹配效果。
③TM_CCOEFF是相关性系数匹配;TM_CCOEFF_NORMED是标准相关性系数匹配。将模版对其均值的相对值与图像对其均值的相关值进行匹配,1表示完美匹配,-1表示糟糕的匹配,0表示没有任何相关性(随机序列)。
总结:随着从简单的测量(平方差)到更复杂的测量(相关系数),我们可获得越来越准确的匹配(同时也意味着越来越大的计算代价)。
参考:
https://blog.csdn.net/guduruyu/article/details/69231259
注意:
参考的第一篇博客的关于模板匹配算法的原理模板图像应该是左上角开始,而不是从中心点开始。在左上角那个点开始计算匹配度,最后得出的最匹配的坐标点是模板图像左上角的位置。
2.opencv的目标匹配函数为matchTemplate,函数原型为:matchTemplate(image, templ, method[, result[, mask]]) -> result
image参数表示待搜索源图像(目标),必须是8位整数或32位浮点。
templ参数表示模板图像,必须不大于源图像并具有相同的数据类型。
method参数表示计算匹配程度的方法。
result参数表示匹配结果图像,必须是单通道32位浮点。如果image的尺寸为W x H,templ的尺寸为w x h,则result的尺寸为(W-w+1)x(H-h+1)。
3.opencv的函数minMaxLoc:在给定的矩阵中寻找最大和最小值,并给出它们的位置。 该功能不适用于多通道阵列。 如果您需要在所有通道中查找最小或最大元素,要先将阵列重新解释为单通道。
函数minMaxLoc原型为:minMaxLoc(src[, mask]) -> minVal, maxVal, minLoc, maxLoc
src参数 表示输入单通道图像。
mask参数 表示用于选择子数组的可选掩码。
minVal参数 表示返回的最小值,如果不需要,则使用NULL。
maxVal参数 表示返回的最大值,如果不需要,则使用NULL。
minLoc参数 表示返回的最小位置的指针(在2D情况下); 如果不需要,则使用NULL。
maxLoc参数 表示返回的最大位置的指针(在2D情况下); 如果不需要,则使用NULL。
参考:https://blog.csdn.net/liuqz2009/article/details/60869427
4.opencv的函数rectangle用于绘制矩形。函数原型为: rectangle(img, pt1, pt2, color[, thickness[, lineType[, shift]]]) -> img
img参数 表示源图像。
pt1参数 表示矩形的一个顶点。
pt2参数 表示与pt1相对的对角线上的另一个顶点 。
color参数 表示矩形线条颜色 (RGB) 或亮度(灰度图像 )。
thickness参数 表示组成矩形的线条的粗细程度。取负值时(如 CV_FILLED)函数绘制填充了色彩的矩形。
lineType参数 表示线条的类型。
shift参数 表示坐标点的小数点位数。