hull and domain渲染阶段
三角细分
控制细化
Unity2017.1.0
1 Hulls and Domains渲染阶段
曲面细分是将表面切成更小更精细的技术。在我们的例子中,我们将三角形细分,最后得到覆盖相同空间的更多更小的三角形。
GPU能够拆分渲染提供给它的三角形。 这样做有多种原因,当三角形的一部分最终被剪切时。 我们无法控制,但是还有一个细分阶段可以配置。 此阶段位于顶点vertex和片段fragment着色器阶段之间, 添加一个Hulls and Domains程序。
1.1 创建Tessellation Shader
创建Tessellation.shader 和 MyTessellation.cginc
Shader "Custom/Tessellation" { … }
#if !defined(TESSELLATION_INCLUDED) #define TESSELLATION_INCLUDED #endif
当使用Tessellation,最小的着色器目标等级是4.6。如果我们不手动设置,Unity将会发出警告并自动使用该级别。我们要把镶嵌阶段添加到base_pass和additive_pass,deferred_pass,阴影通道没必要。
#pragma target 4.6 … #include "MyFlatWireframe.cginc" #include "MyTessellation.cginc"
创建一个quad、材质.
它由两个等腰直角三角形组成。短边长度为1,长对角线长度为√2.
1.2 Hull Shaders程序-整数模式
类似geometry着色阶段,Hull程序可以处理三角形,四边形,或等值线,必须告诉它应该在什么表面上工作,并提供必要的数据。这是赫尔项目的工作。void函数开始
void MyHullProgram () {}
hull program在一个面片上运行,它作为参数传递给hull,添加一个InputPatch参数
void MyHullProgram (InputPatch patch) {}
面片上可能有许多网格顶点,必须指定顶点的数据格式。现在我们将使用VertexData结构体
void MyHullProgram (InputPatch<VertexData> patch) {}
当我们处理三角形时,每个面片将包含三个顶点。这个也必须指定为InputPatch的第二个模板参数
void MyHullProgram (InputPatch<VertexData, 3> patch) {}
hull程序的工作是传递所需的顶点数据到Tessellation阶段。虽然给它提供了一整个面片,但该函数每次只能处理面片中一个顶点,附加一个参数指定hull应该与哪个(顶点)一起工作。该参数是一个无符号整数,具有SV_OutputControlPointID语义
void MyHullProgram ( InputPatch<VertexData, 3> patch, uint id : SV_OutputControlPointID ) {}
先只需将面片作为数组,根据索引id然后返回所需的顶点数据
VertexData MyHullProgram ( InputPatch<VertexData, 3> patch, uint id : SV_OutputControlPointID ) { return patch[id]; }
这看起来像一个函数程序
#pragma vertex MyVertexProgram #pragma fragment MyFragmentProgram #pragma hull MyHullProgram #pragma geometry MyGeometryProgram
这将产生一些编译错误,提示没有正确配置hull着色器。与几何函数一样,它需要属性来配置。首先,我们必须明确地告诉它它适用于三角形。这是通过使用tri作为参数的UNITY_domain属性完成的
[UNITY_domain("tri")] VertexData MyHullProgram …
还必须明确地指定每个三角形一个patch输出三个控制点,
[UNITY_domain("tri")] [UNITY_outputcontrolpoints(3)] VertexData MyHullProgram …
当GPU创建新的三角形时,它需要知道我们想要将它们定义为顺时针还是逆时针。像所有其他三角形一样,它们应该是顺时针的。这是通过UNITY_outputtopology属性来控制的。它的参数应该是triangle_cw
[UNITY_domain("tri")] [UNITY_outputcontrolpoints(3)] [UNITY_outputtopology("triangle_cw")] VertexData MyHullProgram …
GPU还需要通过UNITY_partitioning属性被告知如何分割-整数模式
[UNITY_domain("tri")] [UNITY_outputcontrolpoints(3)] [UNITY_outputtopology("triangle_cw")] [UNITY_partitioning("integer")] VertexData MyHullProgram …
除了划分方法,GPU还需要知道patch应该被分割成多少部分。这不是一个常数值,它可以在每个patch中变化。我们必须提供一个函数来计算它,叫做patch常数函数。
[UNITY_domain("tri")] [UNITY_outputcontrolpoints(3)] [UNITY_outputtopology("triangle_cw")] [UNITY_partitioning("integer")] [UNITY_patchconstantfunc("MyPatchConstantFunction")] VertexData MyHullProgram …
1.3 Patch常数函数
每个patch仅被调用一次patch常数函数,而不是每个顶点都调用一次。实际上,此功能是与MyHullProgram并行运行。
为了确定如何细分三角形,GPU使用了四个细分因子。三角形patch的三个边都有一个因子,必须作为具有SV_TessFactor语义的float数组传递。 三角形的内部也有一个因子,使用SV_InsideTessFactor语义。
struct TessellationFactors
{ float edge[3] : SV_TessFactor; float inside : SV_InsideTessFactor; };
patch常量函数以patch作为输入参数并输出因子。所有因子设置为1,这将导致tessellation阶段不细分patch。
TessellationFactors MyPatchConstantFunction (InputPatch<VertexData, 3> patch) { TessellationFactors f; f.edge[0] = 1; f.edge[1] = 1; f.edge[2] = 1; f.inside = 1; return f; }
1.4 Domain Shaders程序
一个完整的曲面细分阶段需要Hull确定面片,也要Domain生成顶点。
void MyDomainProgram () {}
二者都作用在同一个阶段,再次使用UNITY_domain属性
[UNITY_domain("tri")] void MyDomainProgram () {}
Domain参数需要细分因子以及patch面片.
[UNITY_domain("tri")] void MyDomainProgram ( TessellationFactors factors, OutputPatch<VertexData, 3> patch ) {}
曲面细分阶段确定细分时,它不会产生任何新的顶点。 相反,它会为这些顶点提供重心坐标。 使用这些坐标来导出最终顶点取决于Domain着色器。 为其提供重心坐标它们具有SV_DomainLocation语义。
[UNITY_domain("tri")] void MyDomainProgram ( TessellationFactors factors, OutputPatch<VertexData, 3> patch, float3 barycentricCoordinates : SV_DomainLocation ) {}
在函数内部,我们必须生成最终的顶点数据。
[UNITY_domain("tri")] void MyDomainProgram ( TessellationFactors factors, OutputPatch<VertexData, 3> patch, float3 barycentricCoordinates : SV_DomainLocation ) { VertexData data; }
为了找到这个顶点的位置,使用重心坐标。X、Y和Z坐标决定了第一个、第二个和第三个控制点的权重。
VertexData data; data.vertex = patch[0].vertex * barycentricCoordinates.x + patch[1].vertex * barycentricCoordinates.y + patch[2].vertex * barycentricCoordinates.z;
但是这就必须用同样的方法插值所有数据。让我们为它定义一个方便的宏,它可以用于所有的向量大小
// data.vertex = // patch[0].vertex * barycentricCoordinates.x + // patch[1].vertex * barycentricCoordinates.y + // patch[2].vertex * barycentricCoordinates.z; #define MY_DOMAIN_PROGRAM_INTERPOLATE(fieldName) data.fieldName = \ patch[0].fieldName * barycentricCoordinates.x + \ patch[1].fieldName * barycentricCoordinates.y + \ patch[2].fieldName * barycentricCoordinates.z; MY_DOMAIN_PROGRAM_INTERPOLATE(vertex)
除了顶点位置,还有法线,切线,和所有UV坐标.
MY_DOMAIN_PROGRAM_INTERPOLATE(vertex) MY_DOMAIN_PROGRAM_INTERPOLATE(normal) MY_DOMAIN_PROGRAM_INTERPOLATE(tangent) MY_DOMAIN_PROGRAM_INTERPOLATE(uv) MY_DOMAIN_PROGRAM_INTERPOLATE(uv1) MY_DOMAIN_PROGRAM_INTERPOLATE(uv2)
我们唯一没有插入的是实例id。因为Unity不同时支持GPU实例化和镶嵌,所以复制这个ID是没有意义的。为了防止编译错误,从三次着色器传递中删除多编译指令。这也将从着色器的GUI中移除实例化选项。
//#pragma multi_compile_instancing //#pragma instancing_options lodfade force_same_maxcount_for_gl
现在我们有了一个新的顶点,它将在这一阶段之后被发送到几何程序或插值器。但是这些程序期望插值顶点数据,而不是顶点数据。为了解决这个问题,让Domain着色器接管了原始顶点程序的职责。这是通过在其中调用MyVertexProgram来完成的——就像其他任何函数一样——并返回结果。
[UNITY_domain("tri")] InterpolatorsVertex MyDomainProgram ( TessellationFactors factors, OutputPatch<VertexData, 3> patch, float3 barycentricCoordinates : SV_DomainLocation ) { … return MyVertexProgram(data); }
Now we can add the domain shader to our three shader passes, but we'll still get errors.
#pragma hull MyHullProgram #pragma domain MyDomainProgram
1.5 控制顶点
MyVertexProgram只需要调用一次,只是我们改变了它调用的位置。但是我们仍然需要指定一个顶点程序在顶点着色器阶段被调用,它位于Hull着色器之前。在这一点上,我们不需要做任何事情,所以我们可以使用一个函数,它可以直接通过顶点数据,而不需要修改。
VertexData MyTessellationVertexProgram (VertexData v) { return v; }
使用这个函数给三个着色器的顶点程序传递数据。
#pragma vertex MyTessellationVertexProgram
这将产生另一个编译器错误,提示重用了位置语义。我们必须为我们的顶点程序使用另一个输出结构,使用INTERNALTESSPOS语义来表示顶点位置。结构体的其余部分与VertexData相同,只是它从来没有实例ID。将其命名为TessellationControlPoint。
struct TessellationControlPoint { float4 vertex : INTERNALTESSPOS; float3 normal : NORMAL; float4 tangent : TANGENT; float2 uv : TEXCOORD0; float2 uv1 : TEXCOORD1; float2 uv2 : TEXCOORD2; };
改变MyTessellationVertexProgram它会把顶点数据放入一个控制点结构中并返回那个值
TessellationControlPoint MyTessellationVertexProgram (VertexData v) { TessellationControlPoint p; p.vertex = v.vertex; p.normal = v.normal; p.tangent = v.tangent; p.uv = v.uv; p.uv1 = v.uv1; p.uv2 = v.uv2; return p; }
接下来,MyHullProgram也必须进行更改,以便使用TessellationControlPoint而不是VertexData。只有它的参数类型需要更改.
TessellationControlPoint MyHullProgram ( InputPatch<TessellationControlPoint, 3> patch, uint id : SV_OutputControlPointID ) { return patch[id]; }
patch常数函数也是如此。
TessellationFactors MyPatchConstantFunction ( InputPatch<TessellationControlPoint, 3> patch ) { … }
Domain程序的参数类型也必须改变。
InterpolatorsVertex MyDomainProgram ( TessellationFactors factors, OutputPatch<TessellationControlPoint, 3> patch, float3 barycentricCoordinates : SV_DomainLocation ) { … }
在这一点上,我们终于有了一个正确的Tessellation着色器。
2 细分三角形
整个Tessellation设置的要点是,我们可以细分patch。这允许我们用一组较小的三角形替换单个三角形。我们现在就来做。
2.1 Tessellation Factors
三角形的细分是由它的Tessellation因子控制的。我们在mypatchconstant函数中确定这些因素。目前,我们将它们都设置为1,这不会产生视觉变化。Hull、Domain通过原始的顶点数据并没有产生任何新的东西,将所有因子设置为2,效果立显。
TessellationFactors MyPatchConstantFunction ( InputPatch<TessellationControlPoint, 3> patch ) { TessellationFactors f; f.edge[0] = 2; f.edge[1] = 2; f.edge[2] = 2; f.inside = 2; return f; }
Tessellation因子为2 vs 3.
镶嵌因子是偶数时,中心有一个顶点。当它们是奇数时,中心三角形会有代替。如果我们使用较大的Tessellation因子,我们会得到多个三角形。每向中心移动一步,三角形被细分的数量就会减少2,直到最后得到1或0个子边。
2.1 不同的边和因子组合
三角形如何细分是由因子控制。边缘因子可用于覆盖它们各自的边缘被细分的数量。这只会影响到原始的patch边缘,而不会影响到生成的内部三角形。为了清楚地看到这一点,将内因子设置为7,同时保持边因子为1。
f.edge[0] = 1; f.edge[1] = 1; f.edge[2] = 1; f.inside = 7;
内7,边缘1.
边缘因子也有可能大于内部因子。例如,将边缘因子设置为7,而将内部因子设置为1。
f.edge[0] = 7; f.edge[1] = 7; f.edge[2] = 7; f.inside = 1;
内1 边缘7.
在本例中,内部因子被强制执行为2,因为否则不会生成新的三角形。
2.3 配置因子属性
硬编码不好,增加可配置属性.
float _TessellationUniform; … TessellationFactors MyPatchConstantFunction ( InputPatch<TessellationControlPoint, 3> patch ) { TessellationFactors f; f.edge[0] = _TessellationUniform; f.edge[1] = _TessellationUniform; f.edge[2] = _TessellationUniform; f.inside = _TessellationUniform; return f; }
增加1–64范围限制.
_TessellationUniform ("Tessellation Uniform", Range(1, 64)) = 1
GUI扩展.
void DoTessellation () { GUILayout.Label("Tessellation", EditorStyles.boldLabel); EditorGUI.indentLevel += 2; editor.ShaderProperty ( FindProperty("_TessellationUniform"), MakeLabel("Uniform") ); EditorGUI.indentLevel -= 2; }
在渲染模式和线框部分之间调用OnGUI中的这个方法。仅当所需属性存在时才执行此操作.
public override void OnGUI ( MaterialEditor editor, MaterialProperty[] properties ) { … DoRenderingMode(); if (target.HasProperty("_TessellationUniform")) { DoTessellation(); } if (target.HasProperty("_WireframeColor")) { DoWireframe(); } … }
可配置.
2.4 增加分数模式
尽管我们使用了一个浮点数来设置因子,但我们总是会以每条边的等效细分结束。这是因为我们使用的是整数模式。虽然这是一个很好的模式,看看镶嵌如何工作,它阻止我们平滑过渡之间的细分级别。幸运的是,还有分式划分模式。我们把模式改为fractional_odd。
[UNITY_domain("tri")] [UNITY_outputcontrolpoints(3)] [UNITY_outputtopology("triangle_cw")] [UNITY_partitioning("fractional_odd")] [UNITY_patchconstantfunc("MyPatchConstantFunction")] TessellationControlPoint MyHullProgram …
分数奇数分配
当使用整个奇数因子时,fractional_odd分区模式产生的结果与整数模式相同。但在奇因子之间转换时,额外的边细分会被分离和增长,或者收缩和合并。这意味着边不再总是被分割成等长的段。这种方法的优点是细分层之间的过渡现在是平滑的。
分数偶数分配
3 Tessellation Heuristics
什么因子是最完美的?这是个问题,但这个问题没有一个单一的客观答案。
3.1 边缘优先
细分因子必须提供,可以确定每个顶点的因子,然后对每条边进行平均。这些因子被储存在一个纹理中。在任何情况下,给定一条边的两个顶点,用一个单独的函数来确定系数是很方便的。
float TessellationEdgeFactor ( TessellationControlPoint cp0, TessellationControlPoint cp1 ) { return _TessellationUniform; }
使用这个函数来处理mypatchconstant函数内的边缘因子。
TessellationFactors MyPatchConstantFunction ( InputPatch<TessellationControlPoint, 3> patch ) { TessellationFactors f; f.edge[0] = TessellationEdgeFactor(patch[1], patch[2]); f.edge[1] = TessellationEdgeFactor(patch[2], patch[0]); f.edge[2] = TessellationEdgeFactor(patch[0], patch[1]); f.inside = _TessellationUniform; return f; }
对于内因子,我们只需要用边因子的平均值.
f.inside = (f.edge[0] + f.edge[1] + f.edge[2]) * (1 / 3.0);
3.2 基于边缘长度
由于边因子控制细分多少原始三角形的边,以这些边的长度为基础的因子,这是有意义的。例如,我们可以指定所需的三角形边长。如果我们得到的三角形边比这个长,我们应该把它们再除以所需的长度。为此添加一个变量。
float _TessellationUniform; float _TessellationEdgeLength;
还可以添加属性。我们使用范围从0.1到1,默认值为0.5。这是世界空间单位。
_TessellationUniform ("Tessellation Uniform", Range(1, 64)) = 1 _TessellationEdgeLength ("Tessellation Edge Length", Range(0.1, 1)) = 0.5
我们需要一个着色器功能,使它有可能在基于全部或基于边缘之间切换。使用_TESSELLATION_EDGE关键字,在我们的三次传递中添加必需的指令.
#pragma shader_feature _TESSELLATION_EDGE
接下来,在MyLightingShaderGUI中添加一个enum类型来表示镶嵌模式。
enum TessellationMode { Uniform, Edge }
GUI扩展
void DoTessellation () { GUILayout.Label("Tessellation", EditorStyles.boldLabel); EditorGUI.indentLevel += 2; TessellationMode mode = TessellationMode.Uniform; if (IsKeywordEnabled("_TESSELLATION_EDGE")) { mode = TessellationMode.Edge; } EditorGUI.BeginChangeCheck(); mode = (TessellationMode)EditorGUILayout.EnumPopup( MakeLabel("Mode"), mode ); if (EditorGUI.EndChangeCheck()) { RecordAction("Tessellation Mode"); SetKeyword("_TESSELLATION_EDGE", mode == TessellationMode.Edge); } if (mode == TessellationMode.Uniform) { editor.ShaderProperty( FindProperty("_TessellationUniform"), MakeLabel("Uniform") ); } else { editor.ShaderProperty( FindProperty("_TessellationEdgeLength"), MakeLabel("Edge Length") ); } EditorGUI.indentLevel -= 2; }
边缘模式
现在我们必须调整TessellationEdgeFactor。当定义_TESSELLATION_UNIFORM时,确定两个点的世界位置,然后计算它们之间的距离。这是世界空间中的边长。边因子等于这个长度除以期望的长度.
float TessellationEdgeFactor ( TessellationControlPoint cp0, TessellationControlPoint cp1 ) { #if defined(_TESSELLATION_EDGE) float3 p0 = mul(unity_ObjectToWorld, float4(cp0.vertex.xyz, 1)).xyz; float3 p1 = mul(unity_ObjectToWorld, float4(cp1.vertex.xyz, 1)).xyz; float edgeLength = distance(p0, p1); return edgeLength / _TessellationEdgeLength; #else return _TessellationUniform; #endif }
不同的四边形尺度,相同的期望边长.
因为我们现在用边的长度来确定边的镶嵌因子,我们可以得到每条边的不同因子。你可以看到这种情况发生在四边形上,因为对角线比其他边长。当对四边形使用非均匀尺度,在一维中拉伸它时,这一点也变得很明显。
拉伸quad.
要做到这一点,很重要的一点是,共享一条边的patch最终都要为那条边使用相同的镶嵌因子。否则,生成的顶点将不能沿着那条边匹配,这会在网格中产生可见的缺口。在我们的例子中,我们对所有的边使用相同的逻辑。唯一的区别是控制点参数的顺序。由于浮点数的限制,这在技术上可能会产生不同的因素,但差异将是非常小的,不会被注意到.
3.3 基于屏幕空间边缘长度
虽然我们现在可以控制世界空间中的三角形边长,但这与它们在屏幕空间中的显示方式并不一致。tessellation的要点是增加更多的三角形时。所以我们不想再细分那些看起来很小的三角形。所以让我们用屏幕空间的边长来代替。
首先,改变边长属性的范围。我们将使用像素代替世界单位,所以5-100这样的范围更有意义。
_TessellationEdgeLength ("Tessellation Edge Length", Range(5, 100)) = 50
将世界空间计算替换为屏幕空间计算。要做到这一点,这些点必须转换到剪辑空间而不是世界空间。然后它们的距离在2D中确定,使用它们的X和Y坐标,除以它们的W坐标,将它们投影到屏幕上。
//float3 p0 = mul(unity_ObjectToWorld, float4(cp0.vertex.xyz, 1)).xyz; //float3 p1 = mul(unity_ObjectToWorld, float4(cp1.vertex.xyz, 1)).xyz; //float edgeLength = distance(p0, p1); float4 p0 = UnityObjectToClipPos(cp0.vertex); float4 p1 = UnityObjectToClipPos(cp1.vertex); float edgeLength = distance(p0.xy / p0.w, p1.xy / p1.w); return edgeLength / _TessellationEdgeLength;
现在我们在裁剪空间中得到了结果,它是一个大小为2的统一立方体,适合显示。为了转换为像素,我们必须按像素的显示大小进行缩放。实际上,由于显示器很少是方形的,为了得到最精确的结果,在确定距离之前,我们应该分别缩放X和Y坐标。但是让我们通过简单的缩放屏幕高度来看看它是什么样子.
return edgeLength * _ScreenParams.y / _TessellationEdgeLength;
相同的世界尺寸,不同的屏幕显示尺寸.
们的三角形边缘现在被细分根据他们是多大渲染。位置、旋转和缩放都会影响到这一点。结果,Tessellation的数量改变时,事情在运动。.
3.4 基于视野距离
纯粹依赖于边的视觉长度的一个缺点是,在世界空间中很长的边在屏幕空间中可能会非常小。这可能导致这些边根本没有被细分,而其他边被细分很多,当曲面细分被用来增加近距离的细节或生成复杂的轮廓。
另一种方法是使用世界空间的边缘长度,但是根据视图距离调整因素。越远的东西,它应该在视觉上显得越小,因此它需要的镶嵌就越少。用边长除以边长到摄像机的距离。我们可以用边的中点来确定这个距离。
//float4 p0 = UnityObjectToClipPos(cp0.vertex); //float4 p1 = UnityObjectToClipPos(cp1.vertex); //float edgeLength = distance(p0.xy / p0.w, p1.xy / p1.w); //return edgeLength * _ScreenParams.y / _TessellationEdgeLength; float3 p0 = mul(unity_ObjectToWorld, float4(cp0.vertex.xyz, 1)).xyz; float3 p1 = mul(unity_ObjectToWorld, float4(cp1.vertex.xyz, 1)).xyz; float edgeLength = distance(p0, p1); float3 edgeCenter = (p0 + p1) * 0.5; float viewDistance = distance(edgeCenter, _WorldSpaceCameraPos); return edgeLength / (_TessellationEdgeLength * viewDistance);
我们仍然可以保持Tessellation依赖于显示大小,通过简单地分解屏幕高度,并保持我们的5-100滑块范围。注意,这些值不再直接对应于显示像素。当你改变相机的视场时,这一点是非常明显的,这根本不会影响Tessellation。所以这种简单的方法并不适用于使用可变视场的游戏,例如放大和缩小。
return edgeLength * _ScreenParams.y / (_TessellationEdgeLength * viewDistance);
基于边缘长度和视图距离.
3.5 基于内部因子
虽然Tessellation可能看起来在这一点上工作得很好。当使用一个统一的四边形时,它不是很明显,但是当使用一个变形的立方体时,它就变得很明显。 内部因素不正确的立方体.
在立方体的情况下,组成一个面的两个三角形各有一个非常不同的内部因子。四边形和立方体面之间的唯一区别是定义三角形顶点的顺序。Unity的默认立方体不使用对称的三角形布局,而quad使用对称的三角形布局。这表明,边缘的顺序明显影响内部因子。我们只是取边缘因子的平均值,所以它们的顺序不重要。一定是别的什么地方出了问题。
在计算内部因子时再次显式调用TessellationEdgeFactors函数。从逻辑上讲,这不应该有什么区别,因为我们只是执行了两次完全相同的计算。着色器编译器肯定会优化它.
//f.inside = (f.edge[0] + f.edge[1] + f.edge[2]) * (1 / 3.0); f.inside = (TessellationEdgeFactor(patch[1], patch[2]) + TessellationEdgeFactor(patch[2], patch[0]) + TessellationEdgeFactor(patch[0], patch[1])) * (1 / 3.0);
内部因子正确的立方体.
显然,这确实有效果,因为两面三角形现在最终都使用几乎相同的内部因子。这里发生了什么?
patch常量函数与Hull着色器的其余部分并行调用。但实际上它可以变得更复杂。着色器编译器也能够并行化边缘因子的计算。MyPatchConstantFunction内部的代码被分解和部分复制,并被一个并行计算三个边缘因子的分支进程替换。一旦这三个过程都完成了,他们的结果被结合起来并用来计算内部因素。
它不影响我们的着色器的结果,只会影响它的性能。不幸的是,在OpenGL Core生成的代码中有一个bug。在计算内部因子时,不使用三个边因子,而只使用第三个边因子。它只是访问了索引2三次,而不是索引0,1和2。所以我们总是得到一个内因子等于第三条边因子。
对于patch常数函数,着色器编译器将并行化设置为优先级。它会尽快拆分,然后无法再优化TessellationEdgeFactor的重复调用。我们以三个程序结束,每个程序计算两个点的世界位置、距离、最终因子。然后还有一个计算内部因子的程序,现在它还计算三个点的世界位置,以及所涉及的所有距离和因素。由于我们现在正在对内部因子进行所有工作,因此对边缘因子也单独完成部分工作是没有意义的。
事实证明,如果我们首先计算这些点的世界位置,然后分别对边缘和内部因子计算TessellationEdgeFactor,则着色器编译器将决定不为每个边缘因子分开单独的程序。我们最终得到了一个可以全部计算的流程。在这种情况下,着色器编译器确实优化了TessellationEdgeFactor的重复调用。
float TessellationEdgeFactor (float3 p0, float3 p1) { #if defined(_TESSELLATION_EDGE) // float3 p0 = mul(unity_ObjectToWorld, cp0.vertex).xyz; // float3 p1 = mul(unity_ObjectToWorld, cp1.vertex).xyz; … #else return _TessellationUniform; #endif } TessellationFactors MyPatchConstantFunction ( InputPatch<TessellationControlPoint, 3> patch ) { float3 p0 = mul(unity_ObjectToWorld, patch[0].vertex).xyz; float3 p1 = mul(unity_ObjectToWorld, patch[1].vertex).xyz; float3 p2 = mul(unity_ObjectToWorld, patch[2].vertex).xyz; TessellationFactors f; f.edge[0] = TessellationEdgeFactor(p1, p2); f.edge[1] = TessellationEdgeFactor(p2, p0); f.edge[2] = TessellationEdgeFactor(p0, p1); f.inside = (TessellationEdgeFactor(p1, p2) + TessellationEdgeFactor(p2, p0) + TessellationEdgeFactor(p0, p1)) * (1 / 3.0); return f; }