OpenCV相关函数

一、二值化函数(threshold)

功能:将灰度图像转换为二值图像,通常用于图像分割。通过设置阈值,把图像中低于阈值的像素设为0,高于阈值的像素设为1。

参数

    src:输入图像。

    thresh:阈值,决定哪些像素值将被设置为白色(1)或黑色(0)。

    max_val:最大值,当像素值大于阈值时,赋予的值。

    type:二值化的类型,常用的有cv2.THRESH_BINARY(标准二值化)或cv2.THRESH_BINARY_INV(反向二值化)。

返回值:二值化后的图像。

应用:

import cv2
import numpy as np

# 读取彩色图
img = cv2.imread("./flower.png")

# 调整图片大小为400x400像素
img = cv2.resize(img, (400,400))

# 先转换成灰度图
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

img_binary = np.zeros_like(img_gray)

# 设置一个阈值
thresh = 150

# 遍历灰度图的每一个像素点
for i in range(img_gray.shape[0]):
    for j in range(img_gray.shape[1]):
        if img_gray[i][j] <= thresh:
            img_binary[i, j] = 0
        else:
            img_binary[i, j] = 255

cv2.imshow('image', img)
cv2.imshow('image_gray', img_gray)
cv2.imshow('image_binary', img_binary)
cv2.waitKey(0)

二、自适应二值化函数(adaptiveThreshold)

功能:将灰度图像转换为二值图像,通常用于图像分割。通过设置阈值,把图像中低于阈值的像素设为0,高于阈值的像素设为1。

参数

    src:输入图像。

    thresh:阈值,决定哪些像素值将被设置为白色(1)或黑色(0)。

    max_val:最大值,当像素值大于阈值时,赋予的值。

    type:二值化的类型,常用的有cv2.THRESH_BINARY(标准二值化)或cv2.THRESH_BINARY_INV(反向二值化)。

返回值:二值化后的图像。

应用:

# 导入OpenCV库,用于图像处理
import cv2

# 读取本地的图像文件
img = cv2.imread("lena.png")

# 调整图片大小为400x400像素
img = cv2.resize(img, (400,400))


# 将图像从BGR颜色空间转换为灰度图像
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# 自适应阈值二值化
# 对灰度图像进行自适应二值化处理,以增强图像处理效果
img_adaptive_binary = cv2.adaptiveThreshold(img_gray,      # 参数1:img_gray 输入的灰度图像
                                            255,  # 参数2:255 二值化处理后的最大值
                                            cv2.ADAPTIVE_THRESH_MEAN_C,     # 参数3:cv2.ADAPTIVE_THRESH_MEAN_C 使用局部均值作为阈值计算方法
                                            cv2.THRESH_BINARY,        # 参数4:cv2.THRESH_BINARY 使用二值化阈值处理方式
                                            555,           # 参数5: 邻域大小,用于计算阈值的区域范围
                                            5)    # 参数6: 常数C,计算阈值时从均值中减去的值

# 显示原始图像
cv2.imshow('image', img)
# 显示灰度图像
cv2.imshow('image_gray', img_gray)
# 显示二值图像
cv2.imshow('image_binary', img_adaptive_binary)
# 等待用户按键,这里作为代码执行的暂停点
cv2.waitKey(0)

三、腐蚀函数(erode)

功能:腐蚀操作是一种形态学变换,作用是使图像中的白色区域(前景)缩小。通过最小值滤波器操作,白色区域会被黑色像素“腐蚀”。

参数

    src:输入图像。

    kernel:结构元素(卷积核),定义腐蚀操作的范围和形状。

    iterations:腐蚀操作的次数。

返回值:腐蚀后的图像。

应用:

# 导入OpenCV库,用于图像处理
import cv2

# 读取二值图像文件,准备进行形态学处理
img_binary = cv2.imread("./morph.png")

# 创建一个3x3的椭圆形结构元素,用于形态学操作
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(3,3))

# 对二值图像进行侵蚀操作,iterations参数指定侵蚀的次数
# 侵蚀操作可以用于减少图像中白色区域的大小,这里是5次
img_erode = cv2.erode(img_binary,kernel,iterations=5)

# 显示原始二值图像,用于对比处理效果
cv2.imshow("img_binary",img_binary)
# 显示经过侵蚀操作后的图像
cv2.imshow("img_erode",img_erode)
# 等待用户按键,这里用于保持窗口显示,直到用户按下任意键
cv2.waitKey(0)

四、膨胀函数(dilate)

功能:膨胀操作是一种形态学变换,作用是使图像中的白色区域(前景)扩展。通过最大值滤波器操作,白色区域会向周围黑色像素扩展。

参数

    src:输入图像。

    kernel:结构元素(卷积核),定义膨胀操作的范围和形状。

    iterations:膨胀操作的次数。

返回值:膨胀后的图像。

应用:

import cv2

# 读取图像
img = cv2.imread("./lena.png")

# 调整图片大小为400x400像素
img = cv2.resize(img, (400,400))

# 将图像从BGR颜色空间转换为灰度图像
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

# 自适应阈值二值化
# 对灰度图像进行自适应二值化处理,以增强图像处理效果
img_adaptive_binary = cv2.adaptiveThreshold(img_gray,      # 参数1:输入的灰度图像
                                            255,  # 参数2: 二值化处理后的最大值
                                            cv2.ADAPTIVE_THRESH_GAUSSIAN_C,     # 参数3: 使用局部均值作为阈值计算方法
                                            cv2.THRESH_BINARY_INV,        # 参数4: 使用二值化阈值处理方式
                                            7,           # 参数5: 邻域大小,用于计算阈值的区域范围
                                            5)    # 参数6: 常数C,计算阈值时从均值中减去的值

# 创建椭圆形结构元素
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(3,3))
# 腐蚀图像
img_erode = cv2.erode(img_adaptive_binary,kernel)
# 先腐蚀后膨胀图像
img_erode_dilate = cv2.dilate(img_erode,kernel)

# 显示腐蚀后的图像
cv2.imshow("img_erode",img_erode)
# 显示自适应二值化后的图像
cv2.imshow("img_adaptive_binary",img_adaptive_binary)
# 显示先腐蚀后膨胀的图像
cv2.imshow("img_erode_dilate",img_erode_dilate)
# 等待按键按下
cv2.waitKey(0)

五、仿射变换函数(warpAffine)

功能:仿射变换是一种保持图像平行线不变的几何变换,包括平移、旋转、缩放和剪切。通过仿射矩阵对图像进行变换。

参数

    src:输入图像。

    M:2x3的仿射变换矩阵,用于定义变换的内容(平移、旋转等)。

    dsize:输出图像的尺寸。

    flags:插值方法,常见的有cv2.INTER_LINEARcv2.INTER_NEAREST等。

    borderMode:边界模式,定义如何处理图像边界的像素值。

返回值:变换后的图像。

应用:

import cv2

# 读取图像文件
img = cv2.imread('./lena.png')

# 调整图像大小到400x400像素
img = cv2.resize(img,(400,400))

# 计算图像旋转的变换矩阵,围绕图像中心旋转45度,缩放因子为1
M = cv2.getRotationMatrix2D((img.shape[1]/2, img.shape[0]/2), 45, 1)

# 应用仿射变换,旋转图像
img_warp = cv2.warpAffine(img,  # 要旋转的图像
                          M,    # 变换矩阵
                          (img.shape[1], img.shape[0]), # 输出图像的大小
                          flags=cv2.INTER_LINEAR,   # 插值方式
                          borderMode=cv2.BORDER_WRAP   # 边缘填充方式,默认是常数填充显示为黑色
                          )

# 显示原图像
cv2.imshow('img', img)
# 显示变换后的图像
cv2.imshow('img_warp', img_warp)
# 等待按键按下后关闭所有窗口
cv2.waitKey(0)

六、透视变换函数(warpPerspective)

功能:透视变换是一种更复杂的几何变换,主要用于图像的视角转换,可以模拟拍摄角度的变化。与仿射变换不同,透视变换不保持平行线平行。

参数

    src:输入图像。

     M:3x3的透视变换矩阵,通常通过四个点对应来计算(如cv2.getPerspectiveTransform)。

    dsize:输出图像的尺寸。

    flags:插值方法,常见的有cv2.INTER_LINEARcv2.INTER_CUBIC等。

    borderMode:边界模式,定义如何处理图像边界的像素值。

返回值:透视变换后的图像。

应用:

import cv2
import numpy as np

# 读取图片文件
img = cv2.imread("./card.png")

# 定义原始图像中的四个角点
points1 = np.array([[200,100],[700,150],[140,400],[650,460]], dtype=np.float32)

# 定义目标图像中的四个角点,用于进行透视变换
points2 = np.array([ [0,0], [img.shape[1],0], [0,img.shape[0]], [img.shape[1], img.shape[0]]], dtype=np.float32)

# 计算透视变换矩阵
M = cv2.getPerspectiveTransform(points1, points2)

# 应用透视变换矩阵到原始图像,获得变换后的图像
img_warp = cv2.warpPerspective(img, M, (img.shape[1], img.shape[0]))

# 显示原始图像
cv2.imshow("img", img)
# 显示透视变换后的图像
cv2.imshow("img_warp", img_warp)
# 等待按键按下,然后关闭所有窗口
cv2.waitKey(0)

上一篇:【MySQL】内置函数详解-????️‍????1 日期函数


下一篇:2024.12.14 TCP/IP 网络模型有哪几层?