如果我们想在windows系统上安装GPU版本的AI框架,比如GPU版本的tesnorflow,通常我们会看到类似下面的安装教程
官方版本
- 安装CUDA
- 安装cuDNN
- 配置环境变量
- 安装python环境
- 安装gpu版的tensorflow开发包
咋看上去好像不是很复杂,但是其中坑多到你怀疑人生。
- 下载的cuDNN时候需要注册,而且因为cuDNN文件在外网,下载速度很慢。
- 比如不同版本的tensorflow和CUDA(cuDNN)的版本是有匹配关系的,那你可能会说我先查好他们的这个依赖关系,然后找好合适的版本再安装。
- 比如对于windows系统而言,显卡驱动的版本决定了你能够安装的CUDA版本,有部分教程会忽略这一点。
- ......
假如你幸运地把上面的这些坑全部趟过了,那你还可能会遇到一个问题,就是如果你用pip去安装tensorflow-gpu,还是有可能会报各种神奇的错误。事实上,在windows系统上安装AI框架,最好的方法是用conda,而不是用原生的pip。
总结了上面的这些常见的问题,下面我们开始介绍如何在windows上极简安装GPU版AI框架:
极简版本
- 安装Anaconda
- 新建conda虚拟环境(建议用python3.6,可换国内源)
- 安装显卡驱动(官网下载或者用驱动助手软件)
- 安装AI框架时同时安装cudatoolkit包
- 结束啦
上面我们可以看到,这里我们使用了一个叫做cudatoolkit的包,相当于在conda的虚拟环境里面自动安装了CUDA。大多数时候cudatoolkit中的CUDA和cuDNN是一起安装的,这就省去了很多麻烦,比如说AI框架和CUDA的版本对应问题以及进行手动设置环境变量等等。
具体的安装脚本可参考如下命令:
安装tensorflow
conda create -n py36 python=3.6
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
conda install cudatoolkit tensorflow-gpu
安装pytorch
conda create -n py36 python=3.6
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
conda install pytorch torchvision cudatoolkit=10.1 -c pytorch