搭建实用深度学习环境(Ubuntu16.10+Theano0.8.2+Tensorflow0.11.0rc1+Keras1.1.0)

在动手安装之前,首先要确定硬件,系统,准备安装软件的版本,确定这些软硬件之间是否相互支持或兼容。本文安装的主要环境和软件如下:

Ubuntu16.10+CUDA8.0(cudnn5.1,CNMEM)+Theano0.8.2+Tensorflow0.11.0rc1+Keras1.1.0

显卡型号为Quadro K6000。

深度学习的另外一个比较常用的开发环境是CAFFE,由于之前的很多大牛基于CAFFE做了很多注明的模型,且已经发布到网上,故这套框架更适合于应用。但CAFFE安装起来异常复杂,需要安装非常多的依赖库,以及OpenCv等软件。而且CAFFE框架比较死板,很难修改,个人认为不太适合科研。故本文不涉及CAFFE相关内容。

首先,感谢运维小哥帮我安装ubuntu16.10系统。进入系统后,打开终端,开始安装操作。注意,下面操作命令通常要加sudo,如果切换到超级用户则不需要加。

1.   安装编译环境

主要是make,cmake, gcc,g++,这是linux下最基本的开发环境,有些机器是安装好的,就不用装了。运行每一句终端显示都有反馈,可以根据反馈确定安装是否成功。

sudo apt-get install build-essential

apt install cmake

gcc最新版本是6.2,但CUDA8.0不支持5.0以上版本,需要将版本降低到4.9,下面通过update-alternatives来进行软件版本切换:

sudo apt-get install g++-4.9

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-6 10

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-6 10

sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30

sudo update-alternatives --set cc /usr/bin/gcc

sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30

sudo update-alternatives --set c++ /usr/bin/g++

通过 gcc –v可以查询gcc版本,确定是4.9。

2.   安装CUDA

CUDA是Nvidia公司开发的,基于GPU的并行计算环境,几乎是做深度学习不可或缺的工具,加速效果非常明显。以一个基于Theano的深度模型训练程序为例,普通i5 CPU跑一个epoch需要约80分钟;采用GTX705显卡(48个CUDA核心)加速,跑一个epoch需要约12分钟;采用Quadro K6000显卡(2880个CUDA核心)加速,跑一个epoch仅需要约2分钟。

a)     准备工作

如果安装了用户界面,需要停止X server

sudo /etc/init.d/lightdm stop

sudo /etc/init.d/lightdm status

停止系统自带驱动

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在最后加入一行blacklist nouveau保存,更新一下

sudo update-initramfs -u

重启,通过如下命令确定nouveau被停用,如果返回值为空说明成功。

lsmod | grep nouveau

b)     CUDA包安装

下载cuda_8.0.44_linux.run,我是通过本地下载,通过ftp传到服务器,进入其所在目录,终端中运行:

sh cuda_8.0.44_linux.run

按提示逐步做选择,安装即可。如果之前没有单独安装nvidia的驱动,可以直接在这里选择安装;如果已经安装,则在安装过程中跳过,直接安装cuda和samples。

安装完成后,需要将CUDA的相关路径加入系统路径,用vim打开 ~/.bashrc 文件

vim ~/.bashrc

在文件未尾,加入如下语句来使设置生效:

export PATH=$PATH:/usr/local/cuda/bin

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64

c)      测试CUDA

进入samples所在路径,make

cd /usr/local/cuda/samples

sudo make all -j8

cd bin/x86_64/linux/release/

./deviceQuery

查询出设备信息说明CUDA安装成功

至此,基本的CUDA环境已经完成,但还有两个库可以让计算加速效果更明显,它们是cudnn和cnmem

d)     安装cudnn

cudnn是Nvida专门针对深度神经网络开发的加速包,一定要注意,一些低端的显卡,如GTX580,670,705等不支持cudnn。同时也要注意,cudnn的版本要与CUDA的版本兼容。

下载cudnn-8.0-linux-x64-v5.1.solitairetheme8,解压

cp  cudnn-8.0-linux-x64-v5.1.solitairetheme8 cudnn-8.0-linux-x64-v5.1.tgz

tar -xvf cudnn-8.0-linux-x64-v5.1.tgz

进入解压目录,分别复制h文件和lib文件到cuda的响应目录,进入include目录

sudo cp cudnn.h /usr/local/cuda/include/

再进入lib64目录下的动态文件进行复制和链接:

sudo cp lib* /usr/local/cuda/lib64/

目前的Theano版本与cudnn5.0是兼容的,推荐安装5.0版本。

e)     安装CNMEM

进入安装目录

cd $mydir

git clone https://github.com/NVIDIA/cnmem.git cnmem

cd cnmem

mkdir build

cd build

cmake ..

make

cd ../include

cp cnmem.h /usr/local/cuda/include

cd ../build

cp libcnmem /usr/local/cuda/lib64

3.   安装theano

先安装pip,然后安装theano,theano安装过程中会自动安装numpy和scipy

sudo apt install python-pip

pip install theano

创建~/.theanorc,内容如下

[global]

floatX=float32

device=gpu

base_compiledir=~/external/.theano/

allow_gc=False

warn_float64=warn

[mode]=FAST_RUN

[nvcc]

fastmath=True

[cuda]

root=/usr/local/cuda

[lib]

cnmem=1

在终端中输入python

>>> import theano

输出正常说明安装成功。

4.   安装Tensorflow

如果之前没有安装好python,运行:

sudo apt-get install python-pip python-dev

用pip安装tensorflow

sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.11.0rc1-cp27-none-linux_x86_64.whl

因为墙的原因,可能会失败,需要多试几次

测试tensorflow

在终端中输入python

>>> import tensorflow as tf

>>> hello = tf.constant('Hello, TensorFlow!')

>>> sess = tf.Session()

>>> print sess.run(hello)

Hello, TensorFlow!

>>> a = tf.constant(10)

>>> b = tf.constant(32)

>>> print sess.run(a+b)

42

5.  
安装Keras

Keras之前是以Theano为后台,现在的新版本是以tensorflow为后台的。所以我们要先装好theano和tensorflow之后,最后安装keras。

sudo pip install
keras

对,就这一句话应该就搞定了。安装完成后,在终端输入python

from keras.models
import Sequential

输出正常说明安装成功。

至此,一个比较实用的最新版本深度学习环境就完成了。上述这些软件目前更新非常快,很有可能几个月后就会出现更新版本。安装过程中遇到任何问题,尽量去读官方的安装和说明文档,网络博客,微信上的信息都有一定时效性,包括我这一篇。

在动手安装之前,首先要确定硬件,系统,准备安装软件的版本,确定这些软硬件之间是否相互支持或兼容。本文安装的主要环境和软件如下:

Ubuntu16.10+CUDA8.0(cudnn5.1,CNMEM)+Theano0.8.2+Tensorflow0.11.0rc1+Keras1.1.0

显卡型号为Quadro K6000。

深度学习的另外一个比较常用的开发环境是CAFFE,由于之前的很多大牛基于CAFFE做了很多注明的模型,且已经发布到网上,故这套框架更适合于应用。但CAFFE安装起来异常复杂,需要安装非常多的依赖库,以及OpenCv等软件。而且CAFFE框架比较死板,很难修改,个人认为不太适合科研。故本文不涉及CAFFE相关内容。

首先,感谢运维小哥帮我安装ubuntu16.10系统。进入系统后,打开终端,开始安装操作。注意,下面操作命令通常要加sudo,如果切换到超级用户则不需要加。

1.  
安装编译环境

主要是make,cmake, gcc,g++,这是linux下最基本的开发环境,有些机器是安装好的,就不用装了。运行每一句终端显示都有反馈,可以根据反馈确定安装是否成功。

sudo apt-get
install build-essential

apt install cmake

gcc最新版本是6.2,但CUDA8.0不支持5.0以上版本,需要将版本降低到4.9,下面通过update-alternatives来进行软件版本切换:

sudo apt-get install g++-4.9

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-6 10

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20

sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-6 10

sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30

sudo update-alternatives --set cc /usr/bin/gcc

sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30

sudo update-alternatives --set c++ /usr/bin/g++

通过 gcc –v可以查询gcc版本,确定是4.9。

2.  
安装CUDA

CUDA是Nvidia公司开发的,基于GPU的并行计算环境,几乎是做深度学习不可或缺的工具,加速效果非常明显。以一个基于Theano的深度模型训练程序为例,普通i5 CPU跑一个epoch需要约80分钟;采用GTX705显卡(48个CUDA核心)加速,跑一个epoch需要约12分钟;采用Quadro K6000显卡(2880个CUDA核心)加速,跑一个epoch仅需要约2分钟。

a)     准备工作

如果安装了用户界面,需要停止X server

sudo
/etc/init.d/lightdm stop

sudo
/etc/init.d/lightdm status

停止系统自带驱动

sudo vim
/etc/modprobe.d/blacklist-nouveau.conf

在最后加入一行blacklist nouveau保存,更新一下

sudo
update-initramfs -u

重启,通过如下命令确定nouveau被停用,如果返回值为空说明成功。

lsmod | grep
nouveau

b)     CUDA包安装

下载cuda_8.0.44_linux.run,我是通过本地下载,通过ftp传到服务器,进入其所在目录,终端中运行:

sh
cuda_8.0.44_linux.run

按提示逐步做选择,安装即可。如果之前没有单独安装nvidia的驱动,可以直接在这里选择安装;如果已经安装,则在安装过程中跳过,直接安装cuda和samples。

安装完成后,需要将CUDA的相关路径加入系统路径,用vim打开 ~/.bashrc 文件

vim ~/.bashrc

在文件未尾,加入如下语句来使设置生效:

export
PATH=$PATH:/usr/local/cuda/bin

export
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64

c)      测试CUDA

进入samples所在路径,make

cd /usr/local/cuda/samples

sudo make all -j8

cd bin/x86_64/linux/release/

./deviceQuery

查询出设备信息说明CUDA安装成功

至此,基本的CUDA环境已经完成,但还有两个库可以让计算加速效果更明显,它们是cudnn和cnmem

d)     安装cudnn

cudnn是Nvida专门针对深度神经网络开发的加速包,一定要注意,一些低端的显卡,如GTX580,670,705等不支持cudnn。同时也要注意,cudnn的版本要与CUDA的版本兼容。

下载cudnn-8.0-linux-x64-v5.1.solitairetheme8,解压

cp  cudnn-8.0-linux-x64-v5.1.solitairetheme8
cudnn-8.0-linux-x64-v5.1.tgz

tar -xvf
cudnn-8.0-linux-x64-v5.1.tgz

进入解压目录,分别复制h文件和lib文件到cuda的响应目录,进入include目录

sudo cp cudnn.h
/usr/local/cuda/include/

再进入lib64目录下的动态文件进行复制和链接:

sudo cp lib*
/usr/local/cuda/lib64/

目前的Theano版本与cudnn5.0是兼容的,推荐安装5.0版本。

e)     安装CNMEM

进入安装目录

cd $mydir

git clone
https://github.com/NVIDIA/cnmem.git cnmem

cd cnmem

mkdir build

cd build

cmake ..

make

cd ../include

cp cnmem.h
/usr/local/cuda/include

cd ../build

cp libcnmem /usr/local/cuda/lib64

3.  
安装theano

先安装pip,然后安装theano,theano安装过程中会自动安装numpy和scipy

sudo apt install
python-pip

pip install theano

创建~/.theanorc,内容如下

[global]

floatX=float32

device=gpu

base_compiledir=~/external/.theano/

allow_gc=False

warn_float64=warn

[mode]=FAST_RUN

[nvcc]

fastmath=True

[cuda]

root=/usr/local/cuda

[lib]

cnmem=1

在终端中输入python

>>>
import theano

输出正常说明安装成功。

4.  
安装Tensorflow

如果之前没有安装好python,运行:

sudo apt-get
install python-pip python-dev

用pip安装tensorflow

sudo pip install
--upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.11.0rc1-cp27-none-linux_x86_64.whl

因为墙的原因,可能会失败,需要多试几次

测试tensorflow

在终端中输入python

>>>
import tensorflow as tf

>>> hello = tf.constant('Hello, TensorFlow!')

>>> sess = tf.Session()

>>> print sess.run(hello)

Hello, TensorFlow!

>>> a = tf.constant(10)

>>> b = tf.constant(32)

>>> print sess.run(a+b)

42

5.  
安装Keras

Keras之前是以Theano为后台,现在的新版本是以tensorflow为后台的。所以我们要先装好theano和tensorflow之后,最后安装keras。

sudo pip install
keras

对,就这一句话应该就搞定了。安装完成后,在终端输入python

from keras.models
import Sequential

输出正常说明安装成功。

至此,一个比较实用的最新版本深度学习环境就完成了。上述这些软件目前更新非常快,很有可能几个月后就会出现更新版本。安装过程中遇到任何问题,尽量去读官方的安装和说明文档,网络博客,微信上的信息都有一定时效性,包括我这一篇。

上一篇:你真的了解字典(Dictionary)吗? C# Memory Cache 踩坑记录 .net 泛型 结构化CSS设计思维 WinForm POST上传与后台接收 高效实用的.NET开源项目 .net 笔试面试总结(3) .net 笔试面试总结(2) 依赖注入 C# RSA 加密 C#与Java AES 加密解密


下一篇:LSA和pLSA的比较