早在上世纪七十年代末,Williams在他的“Casting Curved Shadows on Curved Surface”一文中提出了名为Shadow Map的阴影生成技术。之后,他人在此基础上针对相关问题做了许多改进。现在,Shadow Map仍被作为主流的阴影生成技术被广泛应用。
Z缓冲在一开始就是Shadow Map技术的实现基础。讨论Shadow Map技术的意义,不仅在于了解一种阴影生成技术,还在于可借此掌握一种很有用的技术手段。物体表面上一点,只有在与光源之间没有障碍阻隔时,它的深度值才会被保存到Z缓冲中。换个角度看,这就相当于,在物体表面上某点的深度值被保存到Z-Buffer之前,用此点与光源间连线与场景中所有对象做了一次碰撞检测。借用Z-Buffer做碰撞检测的这一方法,还可以用来帮助处理许多其它问题。
一、Shadow Map 原理
Shadow Map实际上比阴影体的原理要简单一些。阴影体是借助Stencil Buffer来做碰撞(观察者视线与阴影体中可能存在的障碍物之间),而Shadow Map则借助Z-Buffer来做碰撞检测。
图 一
如图一所示,假设三维空间中,有物体W在光源L照射下形成阴影。空间中的a点位于W与L之间,c 点位于W之后,而b点是W表面上的一点。a、b、c、d经透视投影变换,在屏幕S上对应着a'、b'、c'、d'四个像素区域。
Shadow Map的思想方法是:假设先在光源L处放置一个摄像机(形成所谓的Light Space),则此像机将会把整个场景投影到相应的投影平面H上,其视锥在H平面上的投影是h1和h2两块区域之合。平面H所对应的Z-Buffer保存的是Light Space的所有对象(本例中仅有W)的深度值。在实际生成观察平面S上的像素时,会先将像素对应的空间中的点(如上图中a'、b'、c'、d'所对应的a、b、c、d)转换到Light Space中,投影到H平面上,并将相应的深度值与事先保存在H平面所对应的Z-Buffer的深度值进行比较,以图一为例,a点会投影到区域h1中,由于它位于W之前,其深度值会比H平面的相应Z-Buffer中的值小;b点在h1上的投影点的深度值等于H平面的相应Z-Buffer中的值;c点在h1上的投影点的深度值,则会大于H平面的相应Z-Buffer中的值;由于在生成H平面的投影时,会事先刷新其Z-Buffer的值,刷新值为1,所以在本例中,空间d点在H上的投影的深度值也将小于相应点的Z-Buffer值;因此,通过空间中某一点在平面H上的投影的深度值与H平面原Z-Buffer中的值的比较结果,就可以判断此点是否处于阴影中,并可根据这个判断来设置观察平面S上的相应像素的颜色。
考虑这样一种情况,空间中的一点如果处于观察者V的视锥中,同时又位于Light Space的视锥之外,那么显然就无法通过上面的方法来判断它是否被阴影所覆盖。这也是Shadow Map的局限之处。
Z-Buffer值一般由图形引擎结合相应硬件,在渲染管线内部计算,用户只需直接调用即可。因此直接使用Z-Buffer的值高效而又方便。但是,通常情况下,Z-Buffer与Stencil Buffer合用4字节空间来描述一个像素,在Shadow Map中用来保存Light Space相应场景对象的深度值一般只有一个字节,而深度值是一个处于0~1之间的浮点数,这样势必会影响到后面的计算精度。这也可看作是传统Shadow Map的另一不足。
绕过Z-Buffer来实现Shadow Map,可以为解决这一问题提供一种方法。
二、Shadow Map的实践
本文的实验是通过Fx Composer 2.5在一台 Laptop上进行的,其内置一块 nVidia GT420M显卡。
图 二
图 三
图二与图三是使用阴影前后的比较。这里没做镜面反射,处于影阴区的像素则被简单地直接涂黑。
首先要做的,是生成一张Shadow Map数据图。因为不使用Z-Buffer,就要做一些额外的创建工作,为了把DIY精神贯彻到底,索性一切从头开始。
1. 先来构建Light Space的相关转换矩阵
设置光源的位置和及Light Space的视锥投射方向:
float3 Lamp0Point = {0.0f,20.0f,0.1f};
float3 Lamp0LookAt = {0.0f,0.0f,0.0f};
1) 计算Light Space的View转换矩阵
设:
则根据仿射坐标系变换公式有:
其中,(xt, yt, zt) 为空间一点p在Light Space坐标系中的坐标;(xr, yr, zr)是点p在原世界坐标系中的坐标;M是原世界坐标系到Light Space坐标系的过渡矩阵;(x0, y0, z0)是Light Space坐标系原点在原世界坐标系中的坐标值。α1、 α2、 α3是Light Space坐标系的基向量,(a11, a12, a13)、(a21, a22, a23)、(a31, a32, a33)是三个坐标轴向量在原世界坐标系中坐标。
由上式可得:
由于直角坐标系基向量互为正交向量,所以有:
据此得到Light Space的View转换矩阵计算函数为:
float4x4 LightViewMat(float3 lampPos, float3 lampLookAt)
{
float3 lampDirt = lampLookAt - lampPos; float3 vUp = float3(0.0f, 1.0f, 0.0f);
float3 vFront = normalize(lampDirt);
float3 vRight = cross(vUp, vFront);
vRight = normalize(vRight);
vUp = cross(vFront, vRight);
vUp = normalize(vUp); // get the matrix from I to II
float4x4 matTrans =
{
, , , ,
, , , ,
, , , ,
-lampPos.x, -lampPos.y, -lampPos.z, ,
}; float4x4 matView =
{
vRight.x, vUp.x, vFront.x, ,
vRight.y, vUp.y, vFront.y, ,
vRight.z, vUp.z, vFront.z, ,
, , , ,
}; float4x4 mView = mul(matTrans, matView); return mView;
}
2) 计算Light Space的投影矩阵
在设定了视锥体近裁剪平面和远裁剪平面的值后,根据给定的y方向的视角,就可以计算出投影平面上透视投影区域在y轴上的坐标范围(top值和bottom值);再根据给出的宽高比(aspect),就可以方便地算出透视投影区域在x轴上的坐标范围(right值和left值)。透视投影矩阵的目的是将视锥转换为x∈[-1,1],y∈[-1, 1],z∈[0, 1]长方体(CVV)。经透视投影矩阵处理后的空间坐标,还要再做一个齐次化处理(将x,y,z值分别除以w)。一个处于视锥体内的点经透视变换和齐次化处理后,其坐标值必处于CVV体的范围内;一个处于视锥体外的点经透视变换和齐次化处理后,其坐标值必处于CVV体范围之外。这就是依靠CVV体进行裁剪的算法依据。实际上,裁剪操作在经过透视矩阵的转换后,在做齐次化处理之前就完成了,这样做可以大大减少运算量。
对于透视变换来说,有了投影平面上的相应点的x、y值,就可以直接画出物体在透视投影后的形状。投影平面上的x、y值通过等比关系就可以计算得到。透视变换后所得的点的z值,因为可以体现空间中各对象间的前后遮挡关系,所以也需要计算并保留下来。在实际计算时,由于要将处于视锥体内的各点的坐标范围转化到CVV体中,故而要通过 z' = a*z+b这种方式(而不是直接依靠几何上的等比关系)构造出来。具体过程可以参看这两篇文章。对于Shadow Map来说,透视投影所得的Z值尤为重要。
float4x4 LightProjcetMat()
{
// get the matrix prjection
float yfov = 1.57f; // 90 degree
float aspect = ViewPortSize.x/ViewPortSize.y;
float n = 6.0f;
float f = 100.0f;
float dfn = f - n; float t = 0.362*n*tan(yfov/);
float b = -t;
float r = t*aspect;
float l = -r;
float drl = r - l;
float dtb = t - b;
float arl = r + l;
float atb = t + b; float4x4 matProj =
{
*n/drl, , , ,
, *n/dtb, , ,
arl/drl, atb/dtb, f/dfn, ,
, , -f*n/dfn, ,
}; return matProj;
}
第10行在计算t值时,多乘了一个0.362的缩放因子(根据实际情况调整),目的在于减少生成Shadow Map时的计算误差。第6行将近裁剪平面设为6.0而不是常见的1.0,也可起到同样的作用。