如何理解CUDA中的cudaMalloc()的参数

首先看下此运行时函数的原型:

cudaError_t cudaMalloc (void **devPtr, size_t  size ); 

主要的第一个参数。为什么是两个星星呢?用个例子来说明下。

float *device_data=NULL;
size_t size = 1024*sizeof(float);
cudaMalloc((void**)&device_data, size);

例子中:

我在显存中申请了一个包含1024个元素的float数组。而device_data这个指针是存储在主存上的。之所以取device_data的地址,是为了将cudaMalloc在显存上获得的数组首地址赋值给device_data。在函数中为形参赋值是不会在实参中繁盛变化的,但是指针传递的是地址,我们操作了某个地址的数据,实际上是真的改变了指定地址的数据。像这个申请显存的函数,第一个参数传递的是device_data这个指针的地址,然后改变这个地址的内容就会带给实参真正的改变。

如何理解CUDA中的cudaMalloc()的参数

上一篇:用3dmax打造房间角落的光雾效果


下一篇:mysql 关联表修改数据