【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

Lec04 变换(续)

文章目录

3D变换(3D Transformation)

和2D类似的变换

同样使用齐次坐标系

  • 3D point = ( x , y , z , 1 ) ⊤ (x,y,z,1)^{\top} (x,y,z,1)⊤
  • 3D vector = ( x , y , z , 0 ) ⊤ (x,y,z,0)^{\top} (x,y,z,0)⊤

四维矩阵实现仿射变换:
[ x ′ y ′ z ′ 1 ] = [ a b c t x d e f t y g h i t z 0 0 0 1 ] [ x y z 1 ] \begin{bmatrix} x^{\prime}\\y^{\prime}\\z^{\prime}\\1 \end{bmatrix}= \begin{bmatrix} a&b&c&t_x\\ d&e&f&t_y\\ g&h&i&t_z\\ 0&0&0&1 \end{bmatrix} \begin{bmatrix} x\\y\\z\\1 \end{bmatrix} ⎣⎢⎢⎡​x′y′z′1​⎦⎥⎥⎤​=⎣⎢⎢⎡​adg0​beh0​cfi0​tx​ty​tz​1​⎦⎥⎥⎤​⎣⎢⎢⎡​xyz1​⎦⎥⎥⎤​
三维空间中,缩放矩阵、平移矩阵和二维情况类似。

绕坐标轴旋转

唯独比较特殊的是旋转矩阵

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

绕y轴旋转矩阵不一样的原因是: x × y = z x\times y=z x×y=z, y × z = x y\times z=x y×z=x,但是 x × z = − y x\times z=-y x×z=−y.

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

从y轴看过去,正常的逆时针旋转其实是x-z坐标轴下的顺时针。因此旋转角要取相反数。

更一般的旋转

3D旋转需要给定旋转轴旋转角度,然后可以分解为以下三个步骤:

  1. 将轴平移到原点(其实大多数情况下轴都默认经过原点

  2. 绕轴旋转。因为轴的方向是任意的,所以这一步还需要分解为绕x、y、z轴的旋转,也即欧拉角(下图是航天飞机的应用):

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

给定过原点的旋转轴向量 n \bold{n} n和旋转角度 α \alpha α,利用罗德里格斯旋转公式(Rodrigues’ rotation formula)可以给出旋转矩阵:

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

右侧的矩阵 N \bold{N} N其实就是叉乘的矩阵形式(见Lec02

公式的推导可以参考这里

  1. 把轴平移回原处(即步骤1的反变换)

旋转矩阵不适合作插值。一般利用四元数进行插值运算。

观测变换(Viewing Transformation)

当我们在拍一张照的时候:

  • 模特找好位置、摆姿势:模型变换(model transformation)
  • 相机找好拍摄位置和角度(view/camera transformation)
  • 茄子!(projection transformation)(把三维空间信息投影到二维图像中)

视图/相机变换(view/camera transformation)

要定义相机的状态,我们需要三个参数:

  • 相机的位置 e ⃗ \vec{e} e
  • 相机看向(gaze)的方向 g ^ \hat{g} g^​
  • 相机的向上(top)方向 t ^ \hat{t} t^(即相机顶面的向外法向量)
【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

在我们已知相机和物体的状态后,不妨将相机和物体一同变换(保证相对位置不变),使得相机处在一个对后续投影变换处理方便的位置上(这是正是视图变换的目的!!!),即:

位于原点,看向-z轴,向上方向是y轴。

为了实现这个(刚体)变换,我们只需:

  • 将 e ⃗ \vec{e} e 平移到原点O

  • 将 g ^ \hat{g} g^​ 旋转到-z轴、将 t ^ \hat{t} t^ 旋转到y轴、将 g ^ × t ^ \hat{g}\times\hat{t} g^​×t^ 旋转到x轴

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

对于旋转矩阵,考虑它的逆矩阵:因为诸如“把x轴旋转到 g ^ × t ^ \hat{g}\times\hat{t} g^​×t^ 向量”的操作更容易实现。将 R v i e w − 1 R_{view}^{-1} Rview−1​ 乘上任意一个坐标轴方向的单位向量,我们就能得到想要的单位向量。而它的逆矩阵恰好是它的转置,这是因为它是一个旋转矩阵,所以具有正交矩阵的性质~

看了看网上的其他博客,还有用欧拉角或者罗德里格斯公式实现世界坐标到相机坐标的转换。不过,我们并不知道如何获取欧拉角的三个维度,以及具体的旋转向量和旋转角。目前看来,本教程的方法是最清晰易懂的。

不过即便如此,我还是有一个问题:相机坐标系本来就是正交的,既然已经把其中两个坐标轴旋转到正确的位置上了,为什么还要旋转第三个坐标轴呢?还是说在旋转第二个坐标轴的时候,会把第一个坐标轴从正确的位置带偏?望大神解答!

投影变换(projection transformation)

正交投影出的图像不体现远近关系,而透视投影则是真实世界的反映。

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

所谓透视,就是从一点发散去看,实现近大远小。试想,在空间中处于同一高度,但离投影平面距离不同的两点,较远的那个点投影到平面上会更低(结合左图想象)。

正交投影(Orthographic Projection)

正交投影很简单,就是丢掉了z轴坐标。步骤如下:

  • 选取视角范围:规定一个[l, r], [b, t], [f, n]立方体视角范围(**因为相机是看向-z轴,所以近处的物体反而z坐标更大。**这一结果并不直观,所以OpenGL使用的是左手系)
  • 将视角范围缩放到[-1, 1], [-1, 1], [-1, 1]的正则立方体中:
    • 将立方体中心移动到原点
    • 将立方体缩放为正则立方体
【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

(这里只是暂时保留z坐标。其实投影到平面上时,z坐标为0)

透视投影(Perspective Projection)

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)
  • 步骤一:把棱台压缩成立方体(把透视投影的视角范围缩放至类似正交投影的矩形)。远处的同一高度的点将会被压缩得更低~
【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

如上图,压缩后,点(x, y, z)变到点(x’, y’, ?). 根据相似三角形关系:

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

至此,我们已经能写出: M p e r s p → o r t h o = ( n 0 0 0 0 n 0 0 ? ? ? ? 0 0 1 0 ) M_{persp\rightarrow ortho}=\begin{pmatrix}n&0&0&0\\0&n&0&0\\?&?&?&?\\0&0&1&0\end{pmatrix} Mpersp→ortho​=⎝⎜⎜⎛​n0?0​0n?0​00?1​00?0​⎠⎟⎟⎞​

那么如何得到第三行的参数?

事实上,我们有以下两个前提

  • 在*面上的点,其z坐标不会变
  • 在远平面上的点,其z坐标不会变

由第一个前提,我们可以得到:

【GAMES101现代计算机图形学入门笔记】Lec04 变换(续)

因为 n 2 n^2 n2 和 x , y x,y x,y 没有关系,所以可以知道 M p e r s p → o r t h o M_{persp\rightarrow ortho} Mpersp→ortho​的第三行肯定是 ( 0 , 0 , A , B ) (0,0,A,B) (0,0,A,B) 形式,且有 A n + B = n 2 An+B=n^2 An+B=n2. 同理,对于远平面的点,有 A f + B = f 2 Af+B=f^2 Af+B=f2 。根据这两个方程,我们解得:
A = n + f ,   B = − n f A=n+f,\ B=-nf A=n+f, B=−nf
于是,我们有: M p e r s p → o r t h o = [ n 0 0 0 0 n 0 0 0 0 n + f − n f 0 0 1 0 ] M_{persp\rightarrow ortho}=\begin{bmatrix}n&0&0&0\\0&n&0&0\\0&0&n+f&-nf\\0&0&1&0\end{bmatrix} Mpersp→ortho​=⎣⎢⎢⎡​n000​0n00​00n+f1​00−nf0​⎦⎥⎥⎤​

  • 步骤二:做正交投影(详见上方)

课后思考题

Q:透视投影中z坐标为 ( n + f ) / 2 (n+f)/2 (n+f)/2的点,在经过透视投影变换后,z值如何变化?

A: [ n 0 0 0 0 n 0 0 0 0 n + f − n f 0 0 1 0 ] [ 0 0 n + f 2 1 ] = [ 0 0 n 2 + f 2 n + f 1 ] \begin{bmatrix}n&0&0&0\\0&n&0&0\\0&0&n+f&-nf\\0&0&1&0\end{bmatrix} \begin{bmatrix}0\\0\\\frac{n+f}{2}\\1\end{bmatrix}= \begin{bmatrix}0\\0\\\frac{n^2+f^2}{n+f}\\1\end{bmatrix} ⎣⎢⎢⎡​n000​0n00​00n+f1​00−nf0​⎦⎥⎥⎤​⎣⎢⎢⎡​002n+f​1​⎦⎥⎥⎤​=⎣⎢⎢⎡​00n+fn2+f2​1​⎦⎥⎥⎤​

且 n 2 + f 2 n + f − n + f 2 = ( n − f ) 2 2 n + 2 f ≥ 0 \frac{n^2+f^2}{n+f}-\frac{n+f}{2}=\frac{(n-f)^2}{2n+2f}\ge0 n+fn2+f2​−2n+f​=2n+2f(n−f)2​≥0,而近处的z坐标大,所以z值变大即变近

上一篇:Red Hat Enterprise Linux 8系统学习(十二)


下一篇:稀疏自编码器及TensorFlow实现