0.序言
每个图像是由一个个点组成的,而这些点可以表示为像素值的形式。
这篇博客里我们将学会:
- 访问像素值并修改它们 。
- 访问图像属性 。
- 设置感兴趣区域(ROI) 。
- 分割和合并图像。
对于图像的基本操作我们需要对numpy知识的了解,不需要很多,只知道基本用法即可。这里暂不赘述,读者可查阅其余资料进行学习。
1.访问和修改像素值
让我们先加载彩色图像:
我们可以通过行和列坐标来访问像素值。对于 BGR 图像,它返回一个由蓝色、绿色和红色值组成的数组。而如果是灰度图像的话,它只返回相应的灰度。我们也可以用相同的方式来对像素值进行修改。
Numpy是用于快速数组计算的优化库。因此,简单地访问每个像素值并对其进行修改将非常慢,因此不建议使用。对于单个像素访问,Numpy数组方法array.item()和array.itemset())被认为更好,但是它们始终返回标量。如果要访问所有B,G,R值,则需要分别调用所有的array.item()。
比如我们可以用下面的方法来进行像素的访问和编辑:
2.访问图像属性
图像属性包括行数,列数,通道数,图像数据类型,像素数等等。
图像的形状可通过 img.shape 访问。它返回行,列和通道数的元组(如果图像是彩色的)
注意:如果图像是灰度的,则返回的元组仅包含行数和列数,因此这是检查加载的图像是灰度还是彩色的好方法。
像素总数可通过访问 img.size :
图像数据类型通过 img.dtype 获得:
注意:img.dtype在调试时非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。
3.图像感兴趣区域ROI
有时候,我们不得不处理一些特定区域的图像。比如对于图像中的眼睛检测,首先对整个图像进行人脸检测。在获取人脸图像时,我们只选择人脸区域,搜索其中的眼睛,而不是搜索整个图像。它提高了准确性和性能。
这里我们直接使用numpy的切片即可,比如:
不规则形状的ROI区域的设置,我们将在以后的文章里再详细阐述。
4.拆分和合并图像通道
有时我们需要分别处理图像的B,G,R通道。在这种情况下,我们需要将BGR图像拆分为单个通道。我们可以这样做:
但是cv.split() 是一项耗时的操作(就时间而言)。因此,仅在必要时才这样做。我们一般采用Numpy索引的方法。比如我们要将所有的红色像素都设置为0:
5.为图像设置边框
如果我们要在图像周围创建边框(如相框),那可以使用 cv.copyMakeBorder() 。它在以后对图像进行高级处理的时候,比如卷积运算,零填充等方面将有更多应用。此函数采用以下参数:
- src - 输入图像
- top,bottom,left,right 边界宽度(以相应方向上的像素数为单位)
- borderType - 定义要添加哪种边框的标志。它可以是以下类型:
- cv.BORDER_CONSTANT - 添加恒定的彩色边框。该值应作为下一个参数给出。
- cv.BORDER_REFLECT - 边框将是边框元素的镜像,如下所示: fedcba | abcdefgh hgfedcb
- **cv.BORDER_REFLECT_101**或 **cv.BORDER_DEFAULT**与上述相同,但略有变化,例如: gfedcb | abcdefgh | gfedcba
- **cv.BORDER_REPLICATE**最后一个元素被复制,像这样: aaaaaa | abcdefgh | hhhhhhh
- **cv.BORDER_WRAP**看起来像这样: cdefgh | abcdefgh | abcdefg
- value -边框的颜色,如果边框类型为**cv.BORDER_CONSTANT**
下面我们来看一下各个边框类型在图片显示上的结果。注意因为图像是基于matplotlib一起显示的。所以红色和蓝色通道将会互换。
结果如下:
?