安装cuda实践

------------恢复内容开始------------

开头想网络安装,发现从invidia下载东西很慢,改为下载到本地再安装。

反正证书之类的,需要先下载到本地再安装。kx上网或者不kx上网,两个方式都尝试下,下载证书或者是安装包。

两个方式都不能下载的话,我安装uget,然后就下载成功了。而,uget网上说需要先add ppa,这样操作是失败的。实际上可以直接apt -y install uget。

安装完后,提示rtl8125之类的错误,于是上网按照https://askubuntu.com/questions/1287896/w-possible-missing-firmware-lib-firmware-rtl-nic-rtl8125a-3-fw-for-module-r816,采取这个方案:

mkdir rtl8125b_fw
cd rtl8125b_fw
wget https://git.kernel.org/pub/scm/linux/kernel/git/firmware/linux-firmware.git/plain/rtl_nic/rtl8125b-2.fw
wget https://git.kernel.org/pub/scm/linux/kernel/git/firmware/linux-firmware.git/plain/rtl_nic/rtl8168fp-3.fw
sudo cp *.fw /lib/firmware/rtl_nic/
sudo update-initramfs -u

它宣称“with reboot afterwards. Didn‘t seen missing firmware warning anymore.”。

实际上并没有达到这个效果。我换用“https://askubuntu.com/questions/1287896/w-possible-missing-firmware-lib-firmware-rtl-nic-rtl8125a-3-fw-for-module-r816” 介绍的内容,git clone <firmware>,然后拷贝到目标位置。

后来重启后,发现分辨率没法调整了,图形界面字体过大,分辨率太小基本上没法使用。

设法解决这个问题,参考https://linuxconfig.org/how-to-install-the-nvidia-drivers-on-ubuntu-18-04-bionic-beaver-linux 和 https://linuxstory.org/how-to-install-latest-nvidia-drivers-in-linux/,

在nvidia-driver-465 和 nvidia-driver-470之间尝试了2次,发现都有分辨率的问题。设法从官网下载驱动(GP107 [GeForce GTX 1050]),安装。

安装后,还是有分辨率的问题,于是用恢复模式启动,补充 broken software。再重启就分辨率问题就好了。这个尝试过2次,应该就是这样。但背后是什么原因,还未知。

上面都出现了 unknown display这个问题,但最后分辨率问题解决后,虽然还是有unknown display,但分辨率是正常的,并且可以调整。

https://www.noobslab.com/2012/10/fix-your-unknown-display-problem-in.html 里面说可以:

sudo apt-get install mesa-utils

glxinfo | grep render

解决unknown display问题,实际上并未解决。

 分辨率问题的最终解决

编辑/etc/default/grub,在里面如此修改。

#GRUB_GFXMODE=640x480
GRUB_GFXMODE=1024x768

 

 访问nvidia关于cuda非常慢,我访问这个网页:http://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=18.04&target_type=deb_local

它指示我要:

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda-repo-ubuntu1804-11-4-local_11.4.0-470.42.01-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-11-4-local_11.4.0-470.42.01-1_amd64.deb
sudo apt-key add /var/cuda-repo-ubuntu1804-11-4-local/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda

 先尝试不通过docker来编译,结果提示必须在docker中编译。于是:

apt-get install apt-transport-https ca-certificates curl gnupg-agent software-properties-common

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -

add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
$(lsb_release -cs) stable"

apt-get update
apt-get install docker-ce docker-ce-cli containerd.io

systemctl enable docker
service start docker

直接apt安装docker是不行的。  上面是参考 https://nixcp.com/docker-command-not-found/ 来操作的。

执行 “bash docker/scripts/dev_start.sh”,前面需要加 sudo。

配置GIT 

在apollo下创建 host目录,放置一些工具

mkdir host

cp /bin/ping  host
cp /lib/x86_64-linux-gnu/libcap.so.2*  host -a
cp /lib/x86_64-linux-gnu/libidn.so*  host -a
cp /sbin/ifconfig  host
cp /usr/local/bin/git*.sh host
cp /usr/local/bin/proxy*.sh  host

git*.sh 和 proxy*.sh 是我写的一些代理的脚本。

编译时报错:“Download from https://github.com/bazelbuild/rules_swift/releases/download/0.12.1/rules_swift.0.12.1.tar.gz failed: class java.io.IOException connect timed out”

运行gitp.sh代理后,这个是仅仅对git进行代理,结果是不行的。运行 proxy.sh后,这种time out错误就消失了。

proxy.sh的内容是:

#!/bin/bash

httpHost=127.0.0.1:7890
export http_proxy=http://$httpHost
export https_proxy=https://$httpHost
export ALL_PROXY=socks5://127.0.0.1:7891

 

------------恢复内容结束------------

 

 

安装cuda实践

上一篇:Q:记录一次ssh毫无规律的断线


下一篇:Swagger