在Linux环境下从头安装tensorflow_gpu版本
本周,开始了实习,为了新的项目,让我在新的Linux环境下从头开始安装tensorflow——gpu版本。之前没有接触过,然后踩了许多坑,所以这里记录一下,同时这次安装也提高了我在使用Linux方面的熟练度,若下面的记录有问题,请及时提出,我会马上更改。
Step1. Anaconda下载及安装
1、官网下载anaconda3Linux版本
2、上传后,用bash命令安装文件
bash FileName
3、安装细节
-
a、在标红框处输入
yes和安装目标路径
-
b、继续选择
yes
-
c、等待安装完成。安装完成后,输入
conda --version
如果显示版本信息则安装成功。-
如果如下图所示无法显示
-
输入
source ~/.bashrc
-
-
Anaconda安装完成。
Step2.安装tensorflow_gpu
1、建立虚拟环境
conda create -n <环境名称> python=<python版本>
2、激活虚拟环境
conda activate <环境名称>
3、在虚拟环境中安装tensorflow-gpu版本
pip install tensorflow-gpu==1.15 -i http://mirrors.aliyun.com/pypi/simple/
4、查看列表是否安装成功
-
conda list
-
- 一定是只要有tensorflow-gpu版本,若出现tensorflow-base版本记得卸载掉
-
TensorFlow GPU版本安装完成
Step3.安装cuda
这里的cuda指的是cudatoolkti,不是驱动,如果没有安装驱动的话,先安装一下驱动,再进行下面的操作。
1、下载cuda
-
下载前的注意事项
-
查找与驱动匹配的cuda版本
-
查看驱动
cat /proc/driver/nvidia/version
-
版本对应表
-
-
查看LInux安装的操作系统
-
查看系统的版本(以Centos为例)
-
cat /etc/redhat-release
查看CentOS版本 -
cat /proc/version
-
-
-
下载地址
-
官网下载:https://developer.nvidia.com/cuda-downloads
-
根据上面的查询到的信息,下载适合自己的版本
-
注:这里Install Type一定要选择
runfile
-
-
2、安装cuda
-
安装指令
sh <cuda文件名字>
-
安装过程
-
安装界面可能不同,但是选项基本相同
-
第一个选
accept
-
第二个安装驱动选
no
- 因为我们之前已经安装过了驱动
-
第三个安装Toolkit 选
yes
-
第四个选地址,默认的是
/usr/local/cuda-10.0
-
第五个都可以
-
第六个安装sample也都可以
-
3、添加环境变量
-
A、打开文件
vim ~/.bashrc
-
B、添加环境变量,在文件的最后三行
export PATH="/usr/local/cuda-10.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH"
export CUDA_HOME="/usr/local/cuda-10.0"
-
C、激活一下~/.bushrc文件,使刚才的添加生效
source ~/.bashrc
4、验证cuda安装是否成功
-
验证指令
-
nvcc -V
- 注意是大V,若输出cuda的版本号、则说明安装成功。若是未出现,则是之前的某一步出现了问题,建议仔细查一遍,若是都没有只能卸载重新来过。
-
Step4.安装cudnn
1、下载cudnn
- 首先点击进入cudann官网:https://developer.nvidia.com/rdp/cudnn-download,需要注册账号。
- 下载的时候要记得和刚才安装的CUDA的版本对应,也不建议太新,就7.6就行。
2、上传及解压
-
下载的文件是.solitairetheme8 文件,所以我们先转一下,然后再解压。
cp <FileName>.solitairetheme8 <FileName>.tgz
tar -xvf <FileName>.tgz
3、复制其中文件,粘贴到刚才的cuda-10.0文件夹中。
cp cudnn/include/cudnn.h /usr/local/cuda-10.0/include/
cp cudnn/lib64/libcudnn* /usr/local/cuda-10.0/lib64
chmod a+r /usr/local/cuda-10.0/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*
Step5.验证安装成功
1、进入之前安装tensorflow的环境
conda activate <env_name>
2、进入python环境
python
3、验证
import tensorflow as tf
print(tf.test.is_gpu_available())
- 最后显示True就成功了。
可能失败的原因
cuda版本问题
-
1、cuda指的不是驱动,驱动已经是安装好的,这里cuda的下载注意两件事
- 不要安装的版本太极限,低版本也可以使用,比如我安装的驱动为10.1,但是我cuda的版本选择是cuda-10.0也可以成功。
- 选择cuda版本下载时要先查好自己电脑的系统版本啥的,之前已经提过了。
-
2、安装时
- 他说要安装驱动的时候选择no,因为我们之前已经装过了。
-
3、添加环境变量
- 这部分可能会出问题,要仔细,地址可能由于不完整出错,若是没成功,可以在这里多试试。
tensorflow问题
- 这边还是建议使用pip指令安装,然后要保证conda list中只有tensorflow-gpu。