一、平台环境
先说一下我自己的平台环境:
-
系统:Ubuntu 20.04.2 LTS
-
CPU:Intel Core i7-7700 @ 3.60GHz*8
-
显卡:NVIDIA GeForce RTX 2060
-
显卡驱动版本:450.102.04
-
CUDA版本:11.0.3
二、Docker的安装和启动
1、运行下面的命令安装:
sudo apt-get update
sudo apt-get install docker.io
2、运行下面的命令启动Docker:
systemctl start docker
systemctl enable docker
3、运行这条命令检查是否安装成功:
sudo docker version
三、安装NVIDIA Container Toolkit
1、添加源(安装之前请先确保显卡驱动已经安装好了)
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - \
&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list \
| sudo tee /etc/apt/sources.list.d/nvidia-docker.list
2、安装NVIDIA Container Toolkit并重启Docker
sudo apt-get update && sudo apt-get install -y nvidia-container-toolkit
sudo systemctl restart docker
3、安装完成之后可以新建一个容器测试一下:
sudo docker run -it --name test_nvidia_docker --gpus all nvidia/cuda:11.0-base
其中最后的参数是nvidia/cuda:11.0-base
是根据我的cuda版本设置的参数,具体可以根据工作站主机的cuda版本进行修改,版本查看旧用nvcc -V
查看。
进入容器之后可以跑一下nvidia-smi
查看到显卡的驱动,然后就可以在docker里正常使用GPU了。
四、Docker常见使用方法
4.1 镜像的生成方法:
1、原创:从无到有,创建镜像
2、借用:下载别人创建好的镜像
3、改进:在现有的镜像上创建新的镜像
查看镜像:
sudo docker iamges
查找镜像:
sudo docker search [OPTION] [TERM]
获取镜像:
sudo docker pull [OPTION] NAME[:TAG|@DIGEST]
删除镜像:
sudo docker rmi [OPTION] IMAGE[IMAGE...]
4.2 容器的基本管理和使用
运行一个新容器:
sudo docker run -it --name [NAME] -V [SOURCE:DESTINATION] --gpus all nvidia/cuda:11.0-base
启动一个已有容器:
sudo docker start [NAME]