环境
- Windows10
- GeForce GTX 960M
- python 3.7.6
- tensorflow-gpu==2.1.0
- CUDA 10.2
- cuDNN v7.9.4.38 for windows10 CUDA10.1(截至到2020-02-21,cuDNN并未发布CUDA v10.2对应的版本)
安装Python
从Python官网下载对应的python版本,我这里选择的是Python 3.7.6。下载完之后就是“下一步”的时间了。
安装tensorflow-gpu
安装完python
之后,打开powershell
,执行命令:
pip3 install tensorflow-gpu
执行完成后,GPU版的tensorflow就安装完成了,CPU版的执行命令pip3 install tensorflow
即可。
安装CUDA 10.2
注意,下载CUDA和cuDNN时,需要注册NVIDA账号。
从这里下载Win10对应的v10.2版CUDA。下载完成后就又到了“下一步”的时间了。
安装cuDNN
从这里下载,windows10系统对应的cuDNN,解压下载后的文件,将其中bin
、include
和lib
文件夹复制到安装了CUDA10.2的路径中,替换掉原来的目录,我这里CUDA10.2的安装目录是C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2
。
之后需要添加环境变量,将C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin
、C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\include
和C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
添加到系统的环境变量中。
测试
打开ipython
,输入以下内容:
import tensorflow as tf
tf.test.is_gpu_avaolable()
True
注意,此时会报错,“cudart64_101.dll not found”,没关系,找到“cudart64_102.dll”,重命名为“cudart64_101.dll”即可。