[OpenCV] Image Processing - Image Elementary Knowledge

"没有坚实的理论基础,实践只会浅尝于表面。"


[OpenCV] Image Processing - Image Elementary Knowledge[OpenCV] Image Processing - Image Elementary Knowledge

这是两本打基础的书,没系统学过的话,怎么好意思说自己会CV。

该领域,兴军亮 这个名字屡次出现,看来是计算机视觉领域国内的年轻才俊,向他学习!


[OpenCV] Image Processing - Image Elementary Knowledge

[OpenCV] Image Processing - Image Elementary Knowledge


2.1.1 几何基元

2D 点:

  • 齐次坐标 (8,4,2)、(4,2,1)表示的都是二维点(4,2)
  • [X Y H]→[OpenCV] Image Processing - Image Elementary Knowledge  = [x y 1], 这个过程称为归一化处理。在几何意义上,相当于把发生在三维空间的变换限制在H=1的平面内。
  • n+1维的齐次坐标中如果h=0,实际上就表示了n维空间的一个无穷远点。

[OpenCV] Image Processing - Image Elementary Knowledge

仿射变换:

[OpenCV] Image Processing - Image Elementary Knowledge

2D 直线:

多一维的意义其中之一便是:

[OpenCV] Image Processing - Image Elementary Knowledge

转化为了极坐标的形式,一种数学技巧而已。

[OpenCV] Image Processing - Image Elementary Knowledge

向量积算法:

[OpenCV] Image Processing - Image Elementary Knowledge

3D 平面:

[OpenCV] Image Processing - Image Elementary Knowledge

3D 直线:

  直线上两点的线性组合:

[OpenCV] Image Processing - Image Elementary Knowledge

/* 其他transform详见2.1 */

/* 2.2光度测定学的图像形成,不是人看的 */

/* 2.3类似,偏物理硬件原理,都是非必备知识 */


色度图

CIE 1931色度图是用标称值表示的CIE色度图,x表示红色分量,y表示绿色分量。E点代表白光,它的坐标为(0.33,0.33);

[OpenCV] Image Processing - Image Elementary Knowledge

环绕在颜色空间边沿的颜色是光谱色,边界代表光谱色的最大饱和度,边界上的数字表示光谱色的波长,其轮廓包含所有的感知色调。所有单色光都位于舌形曲线上,这条曲线就是单色轨迹,曲线旁标注的数字是单色(或称光谱色)光的波长值;自然界中各种实际颜色都位于这条闭合曲线内;RGB系统中选用的物理三基色在色度图的舌形曲线上。

但是,人类视觉系统对色彩的频率响应不如对亮度变化的相应。

YCbCr : Y'为颜色的亮度(luma)成分、而CB和CR则为蓝色和红色的浓度偏移量成份。


图像模式

1、位图模式

位图模式是1位深度的图像。它只是黑和白两种颜色。它可以由扫描或置入黑色的矢量线条图像生成,也能由灰度模式或双色调模式转换而成。其他图像模式不能直接转换为位图模式。

2、灰度模式

灰度模式是8位深度的图像模式。也就是2^8,2^8=256,在全黑和全白之间插有254个灰度等级的颜色来描绘灰度模式的图像。

所有模式的图像都能换成灰度模式,甚至位图也可转换为灰度模式。Photoshop几乎所有的功能都支持灰度模式。

3、双色调模式

双色调模式不是单个的图像模式,而是一个分类。它仅仅是单色调、双色调、三色调和四色调的一个统称。双色调模式只有一个通道。双色调模式和位图模式一样,也只有灰度模式才能转换。

4、RGB模式

RGB模式是数码图像中最重要的一个模式,Photoshop的全部功能都支持它,因为Photoshop就是以它为基础来开发的。显示屏上显示的颜色是RGB模式,电视屏幕也是RGB模式,所不同的它不是用数码而是用电平来描述的。扫描仪和数码相机都是捕捉RGB图像信息的。

RGB模式是相加的模式,当R、G、B的值都达到最大值时,三色合成便成白色。

RGB模式是24位颜色深度。它共有三个通道,每个通道都有8位深度。三个通道合成一起可生成1677万种颜色,我们也称之谓“真彩色”。

5、CMYK模式

CMYK模式是用来打印或印刷的模式,它是相减的模式,当C、M、Y三值达到最大值时,在理论上应为黑色,但实际上因颜料的关系,呈显的不是黑色,而是深褐色。为弥补这个问题,所以加进了黑色K。

由于加了黑色,CMYK共有四个通道,正因为如此,对于同一个图像文件来说,CMYK模式比RGB模式的信息量要大四分之一。

但RGB模式的色域范围比CMYK模式大。因为印刷颜料在印刷过程中不能重现RGB色彩。

CMY 和 RGB 为互补色。

C-青色:由G-绿色和B-蓝色合成,其中没有R-红色成份;

M-洋红:由R-红色和B-蓝色合成,其中没有G-绿色成份;

Y-黄色:由R-绿色和G-红色合成,其中没有B-蓝色成份;

CMYK模式不能转换为索引模式。

Photoshop的大部分功能不支持CMYK模式

6、Lab模式

Lab模式是24位颜色深度的图像模式,有三个通道。L通道是亮度通道(Lightness),a和b两个为色彩通道。它的特点在于:

(1)他的色域范围最广,它和RGB与CMYK模式的关系如下:

就色域范围而言 Lab > RGB > CMYK

(2)此模式下的图像是独立于设备外的,它的颜色不会因不同的印刷设备,显示器和操作平台而改变。由于它有以上的有点,当Photoshop把RGB模式和CMYK模式互相转换时,它成为中间模式,颜色信息就不会因以上两模式的色域范围不同而丢失。

a分量是由绿色向红色过度。

b分量是由蓝色向黄色过渡。

Lab模式不能转换为索引模式。

Photoshop的大部分功能不支持Lab模式。

7、索引颜色模式

索引颜色模式是8位颜色深度模式,它最多只能拥有256种颜色。

(1)每一副图像都各自拥有一张颜色表,而随图像不同,颜色表也不同。这一点是至关重要的。

(2)它的信息量小,又可制动画,所以它的图像和动画被广泛地用于网页制作上。

(3)它可制成透明图像,在网页使用。

在转换时,只有灰度和RGB两种模式,不能转换成索引颜色模式。

转换时只有两个选择是实用的:

(随样性 )当图像颜色数大于256时,使用该选项,Photoshop会定做颜色表。实际当图像颜色小于256时,使用该选项,就用实际的颜色制作颜色表。

Photoshop完全不支持索引颜色模式。

8、多通道模式

多通道模式是把含有通道的图像分割成单个的通道。

CMYK模式转为多通道模式时,生成的通道为青色、洋红、黄色和黑色四个通道。

Lab模式转为多通道模式时,生成三个Alpha通道。

9、8位/通道和16位/通道

在灰度、RGB和CMYK模式下可以用每个通道16位深度来取代8位深度。那么,每个通道的颜色数从256色剧增到65536色,可生成更好的颜色细节。

目前,由于设备的不支持,16位/通道的图像不能被打印或印刷。


[OpenCV] Image Processing - Image Elementary Knowledge

[OpenCV] Image Processing - Image Elementary Knowledge

你是不是发现,右边动来动去的大黑点,在经过某个区域时消失了(大概在二十度左右,亲测)。

这是因为我们人眼的视觉有盲区。

总之,人眼感知与实际光照因为杆状体(暗环境感知)和椎状体(亮环境感知)的主导性不同而有一定的差异。


各种频率的光传播速度都一样,即光速。

但在介质中,不同频率的光线传播速度不同:

频率越高或波长越短的光线具有更高的能量,其受到介质电介性阻碍的影响更大,所以速度越慢。

[OpenCV] Image Processing - Image Elementary Knowledge

扩展:关于伽马射线的原子核仨射线

[OpenCV] Image Processing - Image Elementary Knowledge
首先我们看到图中的三条射线,下面我们进行初步认识

    1. α射线是氦原子核,简称氦核流,它的速度可以达到光速的1/10,电离能力最强,穿透能力最差,在空气中只能前进几厘米,一张纸就可以挡住。
    2. β射线是高速粒子流,速度很大,达光速的99%,穿透能力较强,很容易穿透黑纸,也能穿透几毫米厚的铝板,但是电离能力较弱。
    3. γ射线呈电中性,电离作用小,但穿透能力非常强。可以穿透几十厘米厚的混凝土

感知光强度 (灰度级):

[OpenCV] Image Processing - Image Elementary Knowledge入射分量 乘以 反射分量

[OpenCV] Image Processing - Image Elementary Knowledge  

离散灰度级数范围:[ Lmin, Lmax ] 之间的区域,统一化为[0, L-1]。

上限取决于饱和度,下限取决于噪声。上下限之差为对比度,即动态范围较大。

以下为图像矩阵。

[OpenCV] Image Processing - Image Elementary Knowledge


图像缩放的内插算法

双线性内插

[OpenCV] Image Processing - Image Elementary Knowledge

双三次内插 (商业标准内插方法)

[OpenCV] Image Processing - Image Elementary Knowledge


相邻像素

[OpenCV] Image Processing - Image Elementary Knowledge

[OpenCV] Image Processing - Image Elementary Knowledge

数字图像处理中有4邻接、8邻接和m邻接三种关系。

[OpenCV] Image Processing - Image Elementary Knowledge

[OpenCV] Image Processing - Image Elementary Knowledge

在这个图中

8邻域中的中间的那个1可以有两条路到达右上角的那个1,这就是所说的二义性

这个情况在边缘检测里面是很不希望的。

而改成m邻域以后,中间的1像素和右上角的像素是8连通的却不是m连通的,这可以从m连通的定义得到。

因此,如果用M连通从中间的1到右上角的1就只有一条路。

/* 2.5.2 关于边界的问题,在此标记下 */

/* 2.5.3 距离度量可见KNN */


线性算子

[OpenCV] Image Processing - Image Elementary Knowledge

图像相加

处理噪声图像,叠加后认为噪声相互抵消。

图像相减

增强图像之间的差。

图像相乘(相除)

阴影矫正。


线性变换域 (难点,傅立叶变换时重点研究)

[OpenCV] Image Processing - Image Elementary Knowledge


上一篇:tensorflow实现最基本的神经网络 + 对比GD、SGD、batch-GD的训练方法


下一篇:win10 vs2015源码编译opencv、opencv_contrib、Tesseract