【计算机视觉】边缘检测

2024-12-19 22:48:11

图像的边缘简单来说就是图像中灰度不连续的地方。

1.图像梯度

图像梯度是指图像像素灰度值在某个方向上的变化；图像梯度是图像的一阶导数，实际计算时可以使用差分来近似。

1.1 什么是图像梯度？

图像梯度是一种数学工具，用于描述图像中像素值变化的速度和方向。换句话说，它反映了图像亮度值在空间上的变化率，因此是边缘检测、特征提取和图像分析中常用的重要概念。

1.1.1 图像梯度的定义

给定一幅二维灰度图像 $I (x, y)$ ，它的梯度是一个向量，定义如下：

$\nabla I = \left( \frac{\partial I}{\partial x}, \frac{\partial I}{\partial y} \right)$

$\frac{\partial I}{\partial x} )$ ：图像在 $x$ -方向上的变化率（水平梯度）。
$\frac{\partial I}{\partial y} )$ ：图像在 $y$ -方向上的变化率（垂直梯度）。

梯度的大小和方向定义如下：

梯度大小（Gradient Magnitude）：
$|\nabla I| = \sqrt{\left( \frac{\partial I}{\partial x} \right)^2 + \left( \frac{\partial I}{\partial y} \right)^2}$
梯度方向（Gradient Direction）：
$\theta = \arctan\left(\frac{\frac{\partial I}{\partial y}}{\frac{\partial I}{\partial x}}\right)$

1.1.2 如何计算图像梯度

在离散图像中，梯度的计算通常使用滤波器（卷积核）近似求导数。以下是常见方法：

1. 基本差分（Finite Difference）

利用相邻像素值的差分近似求导数：

$\frac{\partial I}{\partial x} \approx I(x+1, y) - I(x, y) )$
$\frac{\partial I}{\partial y} \approx I(x, y+1) - I(x, y) )$

2. Sobel算子

Sobel算子是一种常用的离散梯度滤波器，使用以下卷积核：

水平梯度核（ $G_x$ ）：
$\begin{bmatrix} -1 & 0 & 1 \\ -2 & 0 & 2 \\ -1 & 0 & 1 \end{bmatrix}$
垂直梯度核（ $G_y$ ）：
$\begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ 1 & 2 & 1 \end{bmatrix}$

使用 Sobel 算子计算出的梯度既平滑了噪声，又能准确提取边缘。

3. Scharr算子

Scharr算子是 Sobel 算子的改进版，能更好地处理图像细节。它的权值分布更均匀，适合高精度梯度计算。

4. 拉普拉斯算子

拉普拉斯算子计算的是二阶导数，用于检测图像的变化区域，而不是简单的一阶变化。

1.2 梯度的计算示例

import cv2 as cv
import numpy as np

# 加载图像
img = cv.imread('example.jpg', cv.IMREAD_GRAYSCALE)

# 计算水平和垂直梯度
grad_x = cv.Sobel(img, cv.CV_64F, 1, 0, ksize=3)  # 水平梯度
grad_y = cv.Sobel(img, cv.CV_64F, 0, 1, ksize=3)  # 垂直梯度

# 计算梯度大小
magnitude = cv.magnitude(grad_x, grad_y)

# 显示结果
cv.imshow('Original', img)
cv.imshow('Gradient X', cv.convertScaleAbs(grad_x))
cv.imshow('Gradient Y', cv.convertScaleAbs(grad_y))
cv.imshow('Gradient Magnitude', cv.convertScaleAbs(magnitude))
cv.waitKey(0)
cv.destroyAllWindows()

1.3 梯度的应用

边缘检测：
- 梯度强度大的地方往往是图像边缘，结合阈值可以提取轮廓（如 Canny 边缘检测）。
特征提取：
- 梯度方向是许多特征描述符（如 SIFT、HOG）的基础。
图像增强：
- 利用梯度信息可以增强图像的边缘或细节。
运动检测：
- 梯度变化在时间序列中的对比可以用来检测运动或变化区域。

2.Canny边缘检测

Canny边缘检测是一种经典的多步骤边缘检测算法，由 John F. Canny 在 1986 年提出。它以鲁棒性、高准确性和抗噪性著称，广泛用于图像处理和计算机视觉任务中。

2.1 算法步骤

Canny 边缘检测分为以下几个步骤：

1. 噪声抑制（平滑处理）

目标：减少噪声对边缘检测的影响。
方法：对图像进行高斯模糊。
高斯模糊会平滑图像中的细节和噪声，同时保留大的结构边缘。

公式（高斯滤波器）：
$\frac{1}{2\pi\sigma^2} e^{-\frac{x^2 + y^2}{2\sigma^2}}$
其中， $\sigma$ 决定平滑程度（模糊核的标准差）。

2. 计算图像梯度

目标：找出图像中的边缘，即像素值变化剧烈的区域。
方法：使用 Sobel 算子计算水平梯度 ( $G_x$ ) 和垂直梯度 ( $G_y$ )，然后计算梯度的大小和方向。

梯度大小（强度）计算公式：
$\sqrt{G_x^2 + G_y^2}$

梯度方向计算公式：
$\theta = \arctan\left(\frac{G_y}{G_x}\right)$
上一篇：RPA 在促销活动自动化处理中的创新应用

码农公寓