安装pytorch

------------恢复内容开始------------

1.安装pytorch

https://pytorch.org/get-started/locally/

在这个网站上根据cuda版本选择命令:

conda install pytorch torchvision cudatoolkit=10.0 -c pytorch

安装过程中出现了:

CondaError: Downloaded bytes did not match Content-Length

解决办法:https://blog.csdn.net/feifei3211/article/details/80361227

其实我之前已经添加了清华源,但是最后两个没有添加:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro/

2.查看是否可用gpu

https://blog.csdn.net/nima1994/article/details/83001910

torch.cuda.is_available()
cuda是否可用

torch.cuda.device_count()
返回gpu数量

torch.cuda.get_device_name(0)
返回gpu名字,设备索引默认从0开始

torch.cuda.current_device()
返回当前设备索引

发现返回的是False,然后用conda list查看,发现没有cudnn,所以尝试安装一下,

安装pytorch

 3.安装cudnn

通过如下命令:

https://blog.csdn.net/lihe4151021/article/details/90237681

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

 

查看版本,发现报错没有这个目录,

https://developer.nvidia.com/rdp/cudnn-archive,cudnn的官网,下载文件需要登陆。

 

安装pytorch

 

 

tar -xvf cudnn-10.0-linux-x64-v7.3.1.20.tgz

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

 

再查看版本就可以查到cudnn了:

安装pytorch

 

但是通过conda list为什么查看不到cudnn呢?有可能是我当前的conda的python环境使用的是cuda9.2,因为我是在安装10.0的cuda之前创建的环境,所以我决定将这个conda环境删除,再重新建一个conda的python环境,又重新安装torch,还是不行。

4.conda list 查看不到cudnn

https://blog.csdn.net/dlhlsc/article/details/88943047,这里的方法是说:

import torch
print(torch.backends.cudnn.enabled)

安装pytorch

 

 似乎是可以的,但是我看了一下安装的内容:

安装pytorch

 并没有自带安装cudnn啊。

上面这个命令只是查看说是否使用cudnn,https://www.cnblogs.com/wanghui-garcia/p/11514502.html。

中间又查看了一下版本:

>>> torch.__version__
'1.4.0'
>>> torch.version.cuda
'10.0'
>>> torch.backends.cudnn.version()
7603

 

解决办法,因为之前cudnn下载下来我是用root用户安装的,是否然后我就没有权限?所以我用我自己的账户在所用的conda的python环境下安装: 

运行如下命令:


tar -xvf cudnn-10.0-linux-x64-v7.6.3.30.tgz #重新解压

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn.h sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

 

 还是不行,而且上面的文件所有者还是root,我不知道这对我是否会有影响,应该不会啊,cuda都是root的,也是可以用的吧。

应该也不是版本的问题,我cuda是10.0.130,cudnn的版本是7.6.3,完全是可以对的上的,我也是按照版本来下载的啊。

 5.torch.cuda.is_available() 为False

 

 

------------恢复内容结束------------

上一篇:Ubantu18.04安装NVIDIA驱动+cuda10.1+cuDNN+Tensorflow2.1(成功)


下一篇:分类贴标签