1、在OpenGL3.0(包含3.0)前,或者使用兼容模式(compatibility profile)环境,OpenGL还包含一个固定功能管线(fixed-function pipeline),这时可以在不编写着色器的情况下处理几何与图像数据。但是从OpenGL 3.1开始,固定功能管线从核心模式中去除,这时处理几何与像素数据就需要编写着色器。
2、4.3版本的图形管线有4个处理阶段,1个通用计算阶段,每个阶段由一个专门的着色器进行控制。
1)顶点着色器(vertex shader)将接受从CPU发送到GPU的顶点数据(顶点坐标、纹理坐标、法线等),独立处理一个顶点,也就是画一个三角新有三个顶点,那么顶点着色器就需要执行,画一条线两个顶点那么只需要执行两次。这个阶段对于OpenGL程序是必须的。
2)细分着色器(tessellation shader)是一个可选阶段,它的作用主要是接受vertex shader的输出经过给定的算法生成新的图元,可用于实现LOD。
3)几何着色器(geometry shader)是一个可选的阶段,它的输入是一个图元,指定 points 就是点、lines 就是这个线的两个端点,这些图元是vertex shader 、tessellation shader的处理结果。初学者可能会有这样的疑惑,只有一个顶点数据是如何画出一个三角形的,这种功能都可以通过tessellation shader、geometry shader完成。
4)片元着色器(fragment shader)处理的是光栅化后的独立片元,也就是像素,这也是OpenGL程序必须的阶段。这个阶段之后会进行各种片元测试混合,经过各种计算得出最后需要显示在电子屏幕上的信息。
5)计算着色器(compute shader)在程序中相对独立,它处理的是程序给定的范围内容,能够处理其它着色器创建或使用的缓存数据,并不是图形管线中的一部分。
3、OpenGL shader 编写语言为 OpenGL Shading Language(GLSL),它与 C 非常相似。
4、计算的不变性:GLSL无法保证不同的着色器之间,相同的计算式相同的输入能够得到完全相同的输出,因为不同的优化方式可能导致非常细微的差异。为此,GLSL使用两种方式确保着色器之间的计算不变性,invariant与precise,但是这种方法无法解决CPU 端与GPU端之间这种差异。如下:
unifrom float ten; //由应用程序传入的10.0f
const float sten = sin(10.0f);
void main()
{
float aten = sin(ten);
if (aten == sten) // 这里因为经过了各自的优化,可能导致不相等
}
1)invariant 限定符可以设置任何着色器的输出变量来确保计算的不变性,当然代价是去除一些GLSL编译器会执行的优化。在调试过程中,可能需要将所有的变量都声明为invariant,可以通过#pragma STDGL invaraint(all) 完成。
2)precise 限定符可以修饰任何计算中的变量或者返回值,通过它增加计算的可复用性,通常在tessellation shader中使用来避免几何体间的裂缝。precise修饰后不能使用两种不同的乘法命令来同时参加计算,但是混合乘加运算对于性能提升非常重要,所以GLSL提供了一个内置函数fma()来代替。
pre:float f = a * b + c * d;(float x = a * b; float f = c * d + x;后面这个算是就是所谓的混合乘加算式)
cur: precise float f; float temp = a * b; f = fma(c, d, temp);
5、uniform 块只能包含透明类型变量与在全局作用域声明,uniform 块的写法:
1)uniform block
{
vec4 v1;
bool v2;
};//访问成员使用的是v1、v2
2)uniform block
{
vec4 v1;
bool v2;
}name;//访问成员使用name.v1、name.v2
6、GLSL中的buffer块,SSBO(shader storage buffer object)的行为类似于uniform块,但 SSBO 对于着色器是可读可写的,再者,它可以在渲染前决定大小而不需要在编译与链接的时候。着色器可以通过length()方法获取渲染是的数组大小。
eg:buffer BufferObject
{
int a;
vec4 points[];//后面这个成员没有给出数组长度,类似于 C 结构体的那个零长数组
};
7、GL_INFO_LOG_LENGTH glGetShaderiv(shaderID, GL_INFO_LOG_LENGTH, &length);
8、GLSL的子程序有点像函数指针,是4.0新增的内容,需要支持扩展 ARB_shader_subroutine
1)定义 subroutine returnType subrotineType(paramType......),returnType可以是任何类型的函数返回值,subroutineType是一个子程序名称,像用 typedef 定义了一种类型
2)定义内容 subroutine (subroutineType) returnType functionName(paramType......)
3)指定一个子程序uniform变量,subroutine uniform subroutineType variableName;
eg:使用子程序实现一个漫反射与环境光照方式动态选择
subroutine vec4 LightFunc(vec3);
subroutine (LightFunc) vec4 ambientCalc(vec3 n) { return Material.ambient; }
subroutine (LightFunc) vec4 diffuseCalc(vec3 n) { return Material.diffuse; }
subroutine uniform LightFunc lightShader;
一个子程序可以同时属于多个类型
在应用程序中,使用GLint glGetSubroutineUniformLocation(GLuint program, GLenum shadertype, const char* name)来获取子程序的索引位置,
接下来就要查找子程序实例的索引GLuint glGetSubroutineIndex(GLuint program, GLenum shadertype, const char* name),
使用GLuint glUniformSubroutinesuiv(GLenum shadertype, GLsizei count,const GLuint* indices)来激活子程序的这些实例,count是子程序实例的个数,indices是子程序实例的索引数组,
最后使用glUniformSubroutinesuiv指定执行哪一个子程序实例。
需要注意的是,每一次调用glUseProgram后,都会重新设置所有子程序uniform的值。