3D Vision 十讲:第一讲

第一讲目录

一、3D视觉与应用介绍

3D 视觉定义

3D 视觉应用

1.Large-scale 3D reconstruction(大规模三维重建)

2.Motion capture(动作捕捉)

3.Augmented reality(增强现实)

二、投影几何

1.投影变换定义

2.投影几何分类

(1)2D投影几何

(2)3D投影几何

三.2D投影几何以及变换

1、2D投影几何应用

2、2D投影平面

3、2D投影中的点

4、 2D投影中的直线

5、 2D投影变换



一、3D视觉与应用介绍

3D 视觉定义

三维视觉是计算机视觉中的一个子领域,它的目的有两个:建模和重建。

所谓的建模是指理解多视角图像中的相互之间几何关系,或者图像和三维世界的几何关系。

重建指的是图像或者深度传感器中重建三维信息(形状和纹理)。

而对合成三维内容的生成不属于三维视觉,它属于计算机图形学。

3D 视觉应用

1.Large-scale 3D reconstruction(大规模三维重建

3D Vision 十讲:第一讲

2.Motion capture(动作捕捉)

从多角度视频中重建

3D Vision 十讲:第一讲

3.Augmented reality(增强现实)

3D Vision 十讲:第一讲

二、投影几何

1.投影变换定义

物体从3D空间转换到图像空间的变换,叫做投影变换。

在投影变换中会改变的几何性质:

  • 长度
  • 角度
  • 距离比

在投影变换中保持不变的几何性质:

  • 直线在变换后依然是直线,共线性质也保持不变
  • 交比保持不变

交比是什么意思?

3D Vision 十讲:第一讲

交比定义为:对于共线的四个点A、B、C、D,它们的交比(A,B; C,D)可以定义为:

                                     (A,B ; C,D)=  3D Vision 十讲:第一讲 = 3D Vision 十讲:第一讲

它们在投影变换下保持不变,即:

                                             3D Vision 十讲:第一讲

2.投影几何分类

(1)2D投影几何

可以消除图像中的投影扭曲、可以做图像拼接。

(2)3D投影几何

对相机投影进行建模用来进行三维重建。矫正和自动校正都可以。

三.2D投影几何以及变换

1、2D投影几何应用

投影扭曲消除

3D Vision 十讲:第一讲

图像拼接

3D Vision 十讲:第一讲

2、2D投影平面

3D Vision 十讲:第一讲

图像平面内一个点在投影空间内是一条射线,比如图像平面点(x, y)可以用一个射线(sx, sy, s)来表示。因此射线上所有点是等效的:(x, y, 1)3D Vision 十讲:第一讲 (sx, sy, s)。

3、2D投影中的点

数学符号3D Vision 十讲:第一讲表示二维投影空间(即投影平面)

  • 点在二维欧式空间3D Vision 十讲:第一讲,也就是卡式坐标为:

                                                           

 3D Vision 十讲:第一讲

  • 点在二维投影空间3D Vision 十讲:第一讲中的表示为:

3D Vision 十讲:第一讲

  • 对于二维投影空间3D Vision 十讲:第一讲中的两个点3D Vision 十讲:第一讲3D Vision 十讲:第一讲,当且仅当3D Vision 十讲:第一讲3D Vision 十讲:第一讲时就称这两个点等效。

  • 二维欧式空间3D Vision 十讲:第一讲3D Vision 十讲:第一讲二维投影空间3D Vision 十讲:第一讲

                                                      3D Vision 十讲:第一讲
  • 二维投影空间3D Vision 十讲:第一讲 3D Vision 十讲:第一讲二维欧式空间3D Vision 十讲:第一讲:

                          3D Vision 十讲:第一讲

对于3D Vision 十讲:第一讲的情况,表示在二维投影空间内的点,在二维欧式空间内没有等效点,它表示无穷远处的点。

4、 2D投影中的直线

(1)2D投影中直线的定义:

对于二维欧式空间3D Vision 十讲:第一讲内一点3D Vision 十讲:第一讲, 对于穿过该点的直线方程我们有:

3D Vision 十讲:第一讲

如果我们令3D Vision 十讲:第一讲3D Vision 十讲:第一讲,那么我们有:

3D Vision 十讲:第一讲

那么3D Vision 十讲:第一讲就表示2D投影空间3D Vision 十讲:第一讲内的一条直线

  • 等效表达:对于3D Vision 十讲:第一讲3D Vision 十讲:第一讲, 即3D Vision 十讲:第一讲3D Vision 十讲:第一讲表示同一条直线。
  • 无穷远点:对于直线3D Vision 十讲:第一讲上无穷远的点,可以表示为3D Vision 十讲:第一讲。而对于所有3D Vision 十讲:第一讲的点,它们均位于无穷远处,被称为理想点(ideal point)。而直线的的理想点,也称为该直线的方向向量。

3D Vision 十讲:第一讲

(2)二维投影平面3D Vision 十讲:第一讲的直线相交

对于两条直线3D Vision 十讲:第一讲, 它们的交点3D Vision 十讲:第一讲为:

3D Vision 十讲:第一讲

其中3D Vision 十讲:第一讲表示叉积。

  • 两条平行线的交点:对于两条平行线3D Vision 十讲:第一讲,它们的交点

3D Vision 十讲:第一讲 为无穷远点

  • 经过两点的直线:对于经过点3D Vision 十讲:第一讲和点3D Vision 十讲:第一讲的直线,它的表达式可以写成3D Vision 十讲:第一讲 。

(3)二维投影平面3D Vision 十讲:第一讲的点与直线对偶性质

对于二维投影几何中的任何定理,都有一个相应的对偶定理,它可以通过互换原定理中点和直线的作用而导出。例如3D Vision 十讲:第一讲3D Vision 十讲:第一讲,过两点的直线与过两直线的点是对偶的。

(4)无穷远处的直线

3D Vision 十讲:第一讲

它满足3D Vision 十讲:第一讲, 而3D Vision 十讲:第一讲表示无穷远的点,即无穷远的直线由无穷远的点组成。

(5)二次曲线(conic应该翻译成二次曲线)

二次曲线顾名思义,由平面上的二阶方程描述。在欧式几何中,二次曲线有三种主要类型:双曲线、椭圆、抛物线。它们都可以用下面的二次曲线方程表示:

3D Vision 十讲:第一讲

考虑如下的对称矩阵:

3D Vision 十讲:第一讲

对于3D Vision 十讲:第一讲, 二次曲线可以表示为:

3D Vision 十讲:第一讲

  • 等效表示:对于3D Vision 十讲:第一讲, 如果有3D Vision 十讲:第一讲, 那么我们称3D Vision 十讲:第一讲等效。
  • 对偶二次曲线:上面的二次曲线的定义是关于点的方程,所以二次曲线3D Vision 十讲:第一讲也叫做点二次曲线。根据上面提到的对偶定理,那么很显然存在一个二次曲线,它是关于直线的方程。我们把这个二次曲线写成3D Vision 十讲:第一讲, 它满足3D Vision 十讲:第一讲

3D Vision 十讲:第一讲

上图左图为点二次曲线3D Vision 十讲:第一讲,右图为3D Vision 十讲:第一讲

5、 2D投影变换

常用的投影变换包含:欧式变换、相似变换、仿射变换、投影变换。它们对原始几何结构的影响如下图所示。

3D Vision 十讲:第一讲

(1)欧式变换

对于齐次坐标的3D Vision 十讲:第一讲,3D Vision 十讲:第一讲

3D Vision 十讲:第一讲

其中

3D Vision 十讲:第一讲

可以看到,欧式变换有三个*度:一个是旋转3D Vision 十讲:第一讲矩阵中的3D Vision 十讲:第一讲, 另外两个是偏移向量3D Vision 十讲:第一讲中的3D Vision 十讲:第一讲

欧式变换是长度和角度均保持不变。

(2)相似变换

3D Vision 十讲:第一讲

在上式中,旋转矩阵3D Vision 十讲:第一讲和偏移向量3D Vision 十讲:第一讲的含义相同,唯一的区别是多了一个缩放因子3D Vision 十讲:第一讲,所以它的*度为4。相似变换是长度比、角度、面积比保持不变

(3)仿射变换

3D Vision 十讲:第一讲

在这里,矩阵3D Vision 十讲:第一讲依然表示偏移向量。但是3D Vision 十讲:第一讲不再是和前面一样的单纯的旋转矩阵。它是一个3D Vision 十讲:第一讲的非奇异矩阵。它总可以进行SVD分解得到:

3D Vision 十讲:第一讲

其中

3D Vision 十讲:第一讲

由此可以看到矩阵3D Vision 十讲:第一讲可以看作是旋转和非均匀缩放的复合操作,它的*度显然是6。不变量是线的平行性质,平行线段的长度比,面积比。

(4)投影变换

3D Vision 十讲:第一讲

其中3D Vision 十讲:第一讲也叫做2D单应性矩阵。

3D Vision 十讲:第一讲

该矩阵是非奇异矩阵,因此代表了一种可逆变换。该矩阵有9个未知量,但只有它们的比率是有意义的,因此它有八个*度。不变量为四个共线点的交比。

  • 投影变换的分解:投影变换可以分解为一串变换链的复合:

3D Vision 十讲:第一讲

即可以看成是相似变换、仿射变换、投影变换的复合。

上一篇:openlayer实现2d地图展示


下一篇:Android屏幕大小适配问题解决