《OpenGL编程指南(原书第9版)》——2.4 数据块接口

2.4 数据块接口

着色器与应用程序之间,或者着色器各阶段之间共享的变量可以组织为变量块的形式,并且有的时候必须采用这种形式。uniform变量可以使用uniform块,输入和输出变量可以使用in和out块,着色器的存储缓存可以使用buffer块。
它们的形式都是类似的。首先了解一下uniform块的写法,第一个变量是匿名数据表,第二个是有名称的数据表。

《OpenGL编程指南(原书第9版)》——2.4 数据块接口

各种类型的块接口的详细介绍如下文所示。综合来说,块(block)开始部分的名称(上面的代码中为b)对应于外部访问时的接口名称,而结尾部分的名称(上面的代码中为name)用于在着色器代码中访问具体成员变量。
2.4.1 uniform块
如果着色器程序变得比较复杂,那么其中用到的uniform变量的数量也会上升。通常会在多个着色器程序中用到同一个uniform变量。由于uniform变量的位置是着色器链接的时候产生的(也就是调用glLinkProgram()的时候),因此它在应用程序中获得的索引可能会有变化,即使我们给uniform变量设置的值可能是完全相同的。而uniform缓存对象(uniform buffer object)就是一种优化uniform变量访问,以及在不同的着色器程序之间共享uniform数据的方法。
正如你所知道的,uniform变量是同时存在于用户应用程序和着色器当中的,因此需要同时修改着色器的内容并调用OpenGL函数来设置uniform缓存对象。
2.4.2 指定着色器中的uniform块
访问一组uniform变量的方法是使用诸如glMapBuffer()的OpenGL函数(参见第3章),但是我们需要在着色器中对它们的声明方式略作修改。不再分别声明每个uniform变量,而是直接将它们成组,形成一个类似结构体的形式,也就是uniform块。一个uniform块需要使用关键字uniform指定。然后将块中所有需要用到的变量包含在一对花括号当中,如例2.3所示。
例2.3 声明一个uniform块
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

注意,着色器中的数据类型有两种:不透明的和透明的;其中不透明类型包括采样器、图像和原子计数器。一个uniform块中只可以包含透明类型的变量。此外,uniform块必须在全局作用域内声明。
uniform块的布局控制
在uniform块中可以使用不同的限制符来设置变量的布局方式。这些限制符可以用来设置单个的uniform块,也可以用来设置所有后继uniform块的排列方式(需要使用布局声明)。可用的限制符及其介绍如表2-12所示。
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

例如,如果需要共享一个uniform块,并且使用行主序的方式来存储数据,那么可以使用下面的代码来声明它:
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

多个限制符可以通过圆括号中的逗号来分隔。如果需要对所有后继的uniform块设置同一种布局,那么可以使用下面的语句:
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

这样一来,当前行之后的所有uniform块都会使用这种布局方式,除非再次改变全局的布局,或者对某个块的声明单独设置专属的布局方式。
如果你在着色器和应用程序之间共享了一块缓存,那么这两者都需要确认成员变量所处的内存偏移地址。因此,这里就需要明确布局设置,也就是std140和std430所提供的功能。
虽然std140和std430已经提供了比较合理的显式缓存布局,但是用户可能还是希望更好的缓存布局控制方式。此时可以通过offset限制符来控制成员的精确位置,或者用align限制符来设置一个模糊的对齐方式。你可以只对某些成员应用这些限制符,从而确保应用程序和着色器之间的布局是同步的。
连续的无限制符成员变量会自动进行偏移位置的对齐,这也是std140和std430的标准。
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

在用户程序设置缓存结构体的时候,可以使用C/C++ struct结构体形式的语言工具,也可以直接向缓存的偏移地址写入数据。这里唯一的问题就是偏移值和对齐方式的可读性。成员变量的地址偏移值是逐渐增加的,并且必须按照std140或者std430的规则对齐。总之,对于浮点数和双精度浮点数的结构体来说,对齐过程是自然的,只不过std140需要对类似vec4这样的类型增加一个额外的16字节对齐的限制。
注意N的定义:GLSL的布局限制符在任何时候都是layout (ID = N)的形式,这里的N必须是一个非负整数。对于#version 430或者更早版本来说,它必须是一个字面整数值。不过从#version 440开始,N也可以是一个常整数的表达式了。
访问uniform块中声明的uniform变量
虽然uniform块已经命名了,但是块中声明的uniform变量并不会受到这个命名的限制。也就是说,uniform块的名称并不能作为uniform变量的父名称,因此在两个不同名的uniform块中声明同名变量会在编译时造成错误。然而,在访问一个uniform变量的时候,也不一定非要使用块的名称。
2.4.3 从应用程序中访问uniform块
uniform变量是着色器与应用程序之间共享数据的桥梁,因此如果着色器中的uniform变量是定义在命名的uniform块中,那么就有必要找到不同变量的偏移值。如果获取了这些变量的具体位置,那么就可以使用数据对它们进行初始化,这一过程与处理缓存对象(使用glNamedBufferSubData()等函数)是一致的。
首先假设已知应用程序的着色器中uniform块的名字。如果要对uniform块中的uniform变量进行初始化,那么第一步就是找到块在着色器程序中的索引位置。可以调用glGetUniformBlockIndex()函数返回对应的信息,然后在应用程序的地址空间里完成uniform变量的映射。
GLuint glGetUniformBlockIndex(GLuint program, const char * uniformBlockName);
返回program中名称为uniformBlockName的uniform块的索引值。如果uniformBlockName不是一个合法的uniform程序块,那么返回GL_INVALID_INDEX。
如果要初始化uniform块对应的缓存对象,那么我们需要使用glBindBuffer()将缓存对象绑定到目标GL_UNIFORM_BUFFER之上(第3章将会给出更详细的解释)。
当对缓存对象进行初始化之后,我们需要判断命名的uniform块中的变量总共占据了多大的空间。我们可以使用函数glGetActiveUniformBlockiv()并且设置参数为GL_UNIFORM_BLOCK_DATA_SIZE,这样就可以返回编译器分配的块的大小(根据uniform块的布局设置,编译器可能会自动排除着色器中没有用到的uniform变量)。glGetActiveUniformBlockiv()函数还可以用来获取一个命名的uniform块的其他一些相关参数。
在获取uniform块的索引之后,我们需要将一个缓存对象与这个块相关联。最常见的方法是调用glBindBufferRange(),或者如果uniform块是全部使用缓存来存储的,那么可以使用glBindBufferBase()。
void glBindBufferRange(GLenum target, GLuint index, GLuint buffer, GLintptr offset, GLsizeiptr size);
void glBindBufferBase(GLenum target, GLuint index, GLuint buffer);
将缓存对象buffer与索引为index的命名uniform块关联起来。target必须是支持索引的某个缓存绑定目标。index是uniform块的索引。offset和size分别指定了uniform缓存映射的起始索引和大小。
调用glBindBufferBase()等价于调用glBindBufferRange()并设置offset为0,size为缓存对象的大小。
在下列情况下调用这两个函数可能会产生OpenGL错误GL_INVALID_VALUE:size小于0;offset+size大于缓存大小;offset或size不是4的倍数;index小于0或者大于等于target设置的绑定目标所支持的最大索引数。
当建立了命名uniform块和缓存对象之间的关联之后,只要使用缓存相关的命令即可对块内的数据进行初始化或者修改。
我们也可以直接设置某个命名uniform块和缓存对象之间的绑定关系,也就是说,不使用链接器内部自动绑定块对象并且查询关联结果的方式。如果多个着色器程序需要共享同一个uniform块,那么你可能需要用到这种方法。这样可以避免对于不同的着色器程序同一个块有不同的索引号。如果需要显式地控制一个uniform块的绑定方式,可以在调用glLinkProgram()之前调用glUniformBlockBinding()函数。
GLint glUniformBlockBinding(GLuint program, GLuint uniformBlockIndex, GLuint uniformBlockBinding);
显式地将块uniformBlockIndex绑定到uniformBlockBinding。
在一个命名的uniform块中,uniform变量的布局是通过各种布局限制符在编译和链接时控制的。如果使用了默认的布局方式,那么需要判断每个变量在uniform块中的偏移量和数据存储大小。为此,需要调用两个命令:glGetUniformIndices()负责获取指定名称uniform变量的索引位置,而glGetActiveUniformsiv()可以获得指定索引位置的偏移量和大小,如例2.4所示。
void glGetUniformIndices(GLuint program, GLsizei uniformCount, const char* uniformNames, GLuint uniformIndices);
返回所有uniformCount个uniform变量的索引位置,变量的名称通过字符串数组uniformNames来指定,程序返回值保存在数组uniformIndices当中。在uniformNames中的每个名称都是以NULL来结尾的,并且uniformNames和uniformIndices的数组元素数都应该是uniformCount个。如果在uniformNames中给出的某个名称不是当前启用的uniform变量名称,那么uniformIndices中对应的位置将会记录为GL_INVALID_INDEX。
例2.4 初始化一个命名uniform块中的uniform变量
《OpenGL编程指南(原书第9版)》——2.4 数据块接口
《OpenGL编程指南(原书第9版)》——2.4 数据块接口
《OpenGL编程指南(原书第9版)》——2.4 数据块接口
《OpenGL编程指南(原书第9版)》——2.4 数据块接口
《OpenGL编程指南(原书第9版)》——2.4 数据块接口
《OpenGL编程指南(原书第9版)》——2.4 数据块接口
《OpenGL编程指南(原书第9版)》——2.4 数据块接口
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

2.4.4 buffer块
GLSL中的buffer块,或者对于应用程序而言,就是着色器的存储缓存对象(shader storage buffer object),它的行为类似uniform块。不过两者之间有两个决定性的差别,使得buffer块的功能更为强大。首先,着色器可以写入buffer块,修改其中的内容并呈现给其他的着色器调用或者应用程序本身。其次,可以在渲染之前再决定它的大小,而不是编译和链接的时候。例如:
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

如果在着色器中没有给出上面的数组的大小,那么可以在应用程序中编译和连接之后,渲染之前设置它的大小。着色器中可以通过length()方法获取渲染时的数组大小。
着色器可以对buffer块中的成员执行读或写操作。写入操作对着色器存储缓存对象的修改对于其他着色器调用都是可见的。这种特性对于计算着色器非常有意义,尤其是对非图像的内存区域进行处理的时候。
有关buffer块的内存限制符(例如coherent)以及原子操作的相关深入讨论请参见第11章。
设置着色器存储缓存对象的方式与设置uniform缓存的方式类似,不过glBindBuffer()、glBindBufferRange()和glBindBufferBase()需要使用GL_SHADER_STORAGE_BUFFER作为目标参数。我们可以在11.2节中看到一个更完整的例子。
如果你不需要写入缓存中,那么可以直接使用uniform块,并且硬件设备本身可能也没有足够的资源空间来支持buffer块,但是uniform块通常是足够的。此外,记住buffer块只可以使用std430布局,而uniform块可以选择std140或者std430布局。
2.4.5 in/out块、位置和分量
着色器变量从一个阶段输出,然后再输入到下一个阶段中,这一过程可以使用块接口来表示。使用逻辑上成组的方式来进行组织也更有利于判断两个阶段的数据接口是否一致,同样对单独程序的链接也会变得更为简单。
例如,一个顶点着色器的输出可能为:
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

它必须与片元着色器的输入是匹配的:
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

顶点着色器可以输出材质和光照的信息,并且都分成独立的数据块。
在本书中,layout (location = N)被用于每个独立的输入和输出变量,但是从OpenGL 4.4版本开始,它也可以作用于输入和输出块的成员,显式地设置它们的位置:
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

无论这些location位置信息是否在块中,都是可以等价于一个vec4的。如果用户希望把多个小的对象设置到同一个位置上,那么也可以使用分量(component)关键字:
《OpenGL编程指南(原书第9版)》——2.4 数据块接口

与其声明一个vec4 combined,然后使用combined.xy和combined.zw来模拟offset和bumpCoord,这个方法显然要好得多。它在块的外部也是可以使用的。
OpenGL着色语言中内置的接口同样也是以块的方式存在的,例如gl_PerVertex,其中包含了内置变量gl_Position等信息。我们可以在附录C中找到一个完整的内置变量列表。

上一篇:删除第三方备份软件残余在Oracle中的备份信息


下一篇:《OpenGL编程指南》一2.4 数据块接口