nvidia-docker安装
如果之前安装过docker1.0版本,需要先删掉该版本和之前创建的容器
- docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
- sudo apt-get purge -y nvidia-docker
添加代码仓库
- curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
- sudo apt-key add -
- distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
- curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
- sudo tee /etc/apt/sources.list.d/nvidia-docker.list
- sudo apt-get update
安装docker 2
sudo apt-get install -y nvidia-docker2 sudo pkill -SIGHUP dockerd
拉取镜像
sudo nvidia-docker pull
查看拉取镜像
sudo nvidia-docker images
文件挂载到镜像
sudo nvidia-docker run -it –v path_local:/workspace /bin/bash
这样就启动了一个容器,并且把目录挂载到了容器的/workspace下。这样操作的好处是,训练完的数据可以直接存放在宿主机,省略了从容器中拷贝的繁琐步骤。
cuda 安装
https://developer.nvidia.com/cuda-downloads中可以下载cuda。
1. 若下载run文件
终端中输入:
sudo sh cuda_8.0.61_375.26_linux.run
会报未知错误:The driver installation has failed due to an unknown error Driver: Installation Failed,网上没找到解决方法,放弃了,使用第二种方法。
2. 若下载deb文件
使用如下命令安装:
sudo dpkg -i cuda-repo-ubuntu1604-8-0-local_8.0.44-1_amd64.deb,
对这句说明下,若无sudo命令,用apt-get install sudo 安装即可。运行过程中,可能会报错,can not install due to decompressor pipe: unexpected end of file or stream,可能解压没成功,多重复操作几次,我连续执行此命令三次,最终成功了。
sudo apt-get update
sudo apt-get install cuda
之后编辑.bashrc:
gedit .bashrc
但是docker容器内无法编辑,会出现
Failed to connect to Mir: Failed to connect to server socket: No such file or directory
Unable to init server: Could not connect: Connection refused
暂时使用临时环境,输入:
export PATH=/usr/local/cuda-8.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/bin/lib64:$LD_LIBRARY_PATH
之后终端中输入:
nvcc --version
显示:
Cuda compilation tools, release 8.0, V8.0.44