问题描述
输入:
nvidia-smi
报错
Failed to initialize NVML: Driver/library version mismatch
解决方法
Step1 卸载现有驱动,重新安装
sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia-*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*
直到下面的命令不输出任何内容,则卸载成功
sudo dpkg --list | grep nvidia-*
重新安装
Step2 添加第三方驱动源
sudo add-apt-repository ppa:graphics-drivers/ppa
Step3 更新软件列表
sudo apt-get update
Step4 安装nvidia
sudo apt-get install nvidia-430
Step5 再次更新软件列表
sudo apt-get update
Step5 更新软件
sudo apt-get upgrade
Step6 重启(一定要重启!)
sudo reboot
遇到问题:在执行Step4 安装nvidia,终端显示缺少ast_dp501_fw.bin
原因分析:
安装ubuntu系统时需要重装Nvidia驱动,当使用低版本的Nvidia.run文件Nvidia驱动时,提示在指定位置找不到ast_dp501_fw.bin的文件,需要将此文件放到指定位置重新安装即可解决此问题
链接:https://pan.baidu.com/s/1DHdz0-INI5gLh__DbdCCKw
提取码:tj04
上述方法若还是不行,则需要重新安装cuda
1.ubuntu卸载CUDA10.1和cudnn
卸载cudnn
sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*
卸载cuda
第一步
sudo /usr/local/cuda-10.1/bin/cuda-uninstaller
第二步
cd /usr/local/
sudo rm -r cuda-10.1
2. 重新安装cuda
下载链接:
笔者选择的是cuda=10.1版本的安装
进入安装包的文件夹,在终端输入:
sudo sh cuda_10.1.243_418.87.00_linux.run
接下来运行整体流程如下所示:
- 终端显示“Do you accept the previously read EULA?” 输入
accept
- 关键一步!!!终端显示“Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?” 一定要输入no!!!!!
- 一路’‘yes’’
- 最后在终端显示如下信息就说明安装成功了
- 安装完成后可在 /usr/local/ 下看到安装好的cuda-10.1
2. 安装cudnn
下载对应版本的cudnn,笔者下载的是cudnn v7.6.5
tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*