#include <cuda.h>
#include <stdio.h>
int getMulprocessorCount(){
cudaDeviceProp prop;
cudaGetDeviceProperties(&prop,);
return prop.multiProcessorCount;
} __constant__ int a[]={,,,,,,,,};
__global__ void add(int *c){
c[]=a[];
} int main(){
int *c;
int h_c[];
int mpc = getMulprocessorCount();
cudaMalloc((void **)&c,*sizeof(int));
add<<<,>>>(c);
cudaMemcpy(h_c,c,sizeof(int)*,cudaMemcpyDeviceToHost);
printf("num is %d",h_c[]);
}
常量内存可以在定义的时候初始化,可以直接在核函数中使用。