将待测逻辑放到局部作用域中(确保各析构函数可以在设备重置前释放),在作用域后加上设备重置函数
{
// your code
}
cudaDeviceReset()
可以使用 cuda-memcheck --leak-check full <bin>
进行内存检查
如果遇到 all CUDA-capable devices are busy or unavailable
错误,可以使用如下命令为设备文件添加全局权限
sudo chmod a+rw /dev/nvhost-dbg-gpu