【Ubuntu】终端输入nvidia-smi时报错:Failed to initialize NVML: Driver/library version mismatch

问题描述

输入:

nvidia-smi

报错

Failed to initialize NVML: Driver/library version mismatch

解决方法

Step1 卸载现有驱动,重新安装

sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia-*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*

直到下面的命令不输出任何内容,则卸载成功

sudo dpkg --list | grep nvidia-*

重新安装
Step2 添加第三方驱动源

sudo add-apt-repository ppa:graphics-drivers/ppa

Step3 更新软件列表

sudo apt-get update

Step4 安装nvidia

sudo apt-get install nvidia-430

Step5 再次更新软件列表

sudo apt-get update

Step5 更新软件

sudo apt-get upgrade

Step6 重启(一定要重启!)

sudo reboot

遇到问题:在执行Step4 安装nvidia,终端显示缺少ast_dp501_fw.bin

原因分析:
安装ubuntu系统时需要重装Nvidia驱动,当使用低版本的Nvidia.run文件Nvidia驱动时,提示在指定位置找不到ast_dp501_fw.bin的文件,需要将此文件放到指定位置重新安装即可解决此问题
链接:https://pan.baidu.com/s/1DHdz0-INI5gLh__DbdCCKw
提取码:tj04

上述方法若还是不行,则需要重新安装cuda

1.ubuntu卸载CUDA10.1和cudnn

卸载cudnn

sudo rm -rf /usr/local/cuda/include/cudnn.h
sudo rm -rf /usr/local/cuda/lib64/libcudnn*

卸载cuda
第一步

sudo /usr/local/cuda-10.1/bin/cuda-uninstaller

第二步

cd /usr/local/
sudo rm -r cuda-10.1

2. 重新安装cuda

下载链接:
笔者选择的是cuda=10.1版本的安装
进入安装包的文件夹,在终端输入:

sudo sh cuda_10.1.243_418.87.00_linux.run

接下来运行整体流程如下所示:

  • 终端显示“Do you accept the previously read EULA?” 输入accept
  • 关键一步!!!终端显示“Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?” 一定要输入no!!!!!
  • 一路’‘yes’’
  • 最后在终端显示如下信息就说明安装成功了
    【Ubuntu】终端输入nvidia-smi时报错:Failed to initialize NVML: Driver/library version mismatch
  • 安装完成后可在 /usr/local/ 下看到安装好的cuda-10.1
    【Ubuntu】终端输入nvidia-smi时报错:Failed to initialize NVML: Driver/library version mismatch

2. 安装cudnn

下载对应版本的cudnn,笔者下载的是cudnn v7.6.5

tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda-10.0/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-10.1/lib64
sudo chmod a+r /usr/local/cuda-10.1/include/cudnn.h /usr/local/cuda-10.0/lib64/libcudnn*
上一篇:win10显卡驱动+cuda+cudnn安装


下一篇:Win10下安装PaddlePaddle