解决Ubuntu重启之后NVIDIA驱动屡次失效:报错NVIDIA-SMI has failed because it couldn't communicate with the NVIDI

服务器安装了Ubuntu20.4每次关机开机之后nvidia驱动就失效了

参考这2篇文档把问题解决了,虽然中间还出现mismatch的问题,但是不管了直接暴力重装吧(可能是系统内核自动升级之后的版本与原先安装的驱动程序版本不匹配的原因,nvidia驱动安装成功后,显卡kernel Module版本才会更新?)

解决关机开机后显卡失效:   https://www.jianshu.com/p/3cedce05a481  

解决安装nvidia驱动过程中,nvidia-drm正在被使用:https://blog.csdn.net/u010087338/article/details/107585801

首先按照下nvidia驱动:

$sudo service lightdm stop  #停Xserver

$sudo /usr/bin/nvidia-uinstall

$sudo chmod a+x NVIDIA-Linux-X86_64-型号.run

$sudo ./NVIDIA-Linux-x86_64-型号.run -no-x-check -no-nouveau-check -no-opengl-files#关闭x服务检查/禁用nouveau检查、不安装OpenGL

中间遇到一个erro:

An NVIDIA kernel module 'nvidia-drm'  appears to already be loaded in your kernel....

解决方法:

清除NVIDIA驱动,以下指令删除Nvidia的驱动程式,并使用autoremove移除所有不必要的相关套件

$sudo apt-get purge nvidia*

$sudo apt-get autoremove

$sudo reboot

完美解决~~

 

 

接下来解决nvidia驱动失效了......................可能内核版本与安装驱动时的版本不匹配?特别是系统更新之后,与原始NVIDIA驱动不匹配?

解决:

$sudo apt-get install dkms#DKMS全称是Dynamic Kernel Module Support,它可以帮助完美维护内核外的这些驱动程序,

在内核版本变动之后可以自动重新生成新的模块

$sudo dkms install -m nvidia -v 460.76 #460.76是安装驱动的版本

中间又出了个error:

ERROR(dkms apport): binary package for nvidia: 460.76not found!这个是gcc版本过低导致的,目前gcc版本是7.5,切换到gcc9.3即可。

$sudo update-alternatives --config gcc

解决Ubuntu重启之后NVIDIA驱动屡次失效:报错NVIDIA-SMI has failed because it couldn't communicate with the NVIDI

 

选择相应需要切换的gcc版本即可

验证下 nvidia-smi

解决Ubuntu重启之后NVIDIA驱动屡次失效:报错NVIDIA-SMI has failed because it couldn't communicate with the NVIDI

 

 重启仍然有效~

 

上一篇:ubuntu打实时内核补丁教程以及安装后显卡驱动问题解决方法


下一篇:安装TensorFlow GPU版本