Python包管理工具和多版本环境管理

1. Python包管理工具

在安装Python包的过程中,经常涉及到distutils、setuptools、distribute、setup.py、easy_install、easy_install和pip等等。突然对Python的包管理凌乱了,这些工具关系是什么,应该怎么去选择使用?

下面就简单介绍下Python包管理相关的一些内容。

1.1 distutils

distutils 是 python 标准库的一部分,这个库的目的是为开发者提供一种方便的打包方式, 同时为使用者提供方便的安装方式。我们经常使用的setup.py就是基于distutils实现的,然后通过setup.py就可以进行打包或者安装了。

看一个简单的例子,找一个目录创建两个文件foo.py和setup.py,内容如下:

1 # foo.py
2 def func():
3 print 'hello world!'
1 # setup.py
2 from distutils.core import setup
3 setup(
4 name='foo',
5 version='1.0',
6 author='winter',
7 author_email='winter@126.com',
8 py_modules=['foo'],
9 )

然后,在该目录中运行如下命令:

Python包管理工具和多版本环境管理

会创建dist文件和一个foo-1.0.zip压缩文件,使用者就可以解压缩这个包,然后执行python  setup.py install进行安装,然后就可以使用这个foo模块了。

Python包管理工具和多版本环境管理

关于更过如何编写setup.py的内容,请自行参阅Python官方文档中的setupscript部分

1.2 setuptools 和 distribute

setuptools 是对 distutils 的增强,尤其是引入了包依赖管理。我们可以通过ez_setup.py来安装setuptools。

至于distribute,它是setuptools的一个分支版本。分支的原因是有一部分开发者认为 setuptools 开发太慢。但现在,distribute 又合并回了 setuptools 中,所以可以认为它们是同一个东西。

前面看到setup.py可以创建一个压缩包,而setuptools使用了一种新的文件格式(.egg),可以为Python包创建 egg文件。setuptools 可以识别.egg文件,并解析、安装它。

1.3 easy_install

首先,不推荐使用,因为只能安装不能卸载

当安装好setuptools/distribute之后,我们就可以直接使用easy_install这个工具了:

1) 从PyPI上安装一个包:当使用 easy_install package 命令后,easy_install 可以自动从 PyPI 上下载相关的包,并完成安装,升级

2) 下载一个包安装:通过 easy_install package.tgz 命令可以安装一个已经下载的包

3) 安装egg文件:通过 easy_install package.egg 可以安装一个egg格式的文件

根据上面的分析,可以看到setuptools/distribute和easy_install之间的关系:

a)setuptools/distribute 都扩展了 distutils,提供了更多的功能

b)easy_install是基于setuptools/distribute的一个工具,方便了包的安装和升级

1.4 PIP

pip是目前最流行的Python包管理工具,它被当作easy_install的替代品,但是仍有大量的功能建立在setuptools之上。

easy_install 有很多不足:安装事务是非原子操作,只支持 svn,没有提供卸载命令, 安装一系列包时需要写脚本。pip 解决了以上问题,已经成为新的事实标准。

通过pip –help查看帮助文档,cmd下直接运行pip命令;

如果你对yum和apt-get比较熟悉,那么pip的命令会让你有种似曾相识的感觉;

pip常用命令集合:

1)安装包

pip install SomePackage        #从PyPI安装PyPI上最新的软件包
pip install SomePackage==1.0.4 #安装指定版本的软件包
pip install 'SomePackage>=1.0.4' #安装版本不能低于1.0.4
pip install ./downloads/SomePackage-1.0.4.tar.gz #本地安装
pip install http://my.package.repo/SomePackage-1.0.4.zip #从网上某个链接安装

还有一个根据依赖文件安装:

pip freeze > requirements.txt        # 使用pip导出依赖文件列表
pip install -r requirements.txt # 根据依赖文件列表,自动安装对应的软件包

2)升级包

pip list --outdated    #查看可升级软件包
pip install --upgrade SomePackage #升级软件包

3)卸载包

pip uninstall SomePackage

4)查询包

pip list    #查看已安装软件包
pip show --files SomePackage #查看软件包安装了哪些文件及路径等信息
pip search “query” #不知道要安装的软件包的具体名称,使用search命令进行查询,会列出相关的包

5)配置镜像源

pip的镜像地址默认在国外,速度比较慢,可以设置为国内镜像源

a)linux

修改 ~/.pip/pip.conf (Linux/Mac)

b)windows

C:\Users\当前用户名\pip\pip.ini(没有pip.ini就创建一个)

国内的可以配置成清华的镜像源,配置为:

[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple

6)pip代理设置

pip install xxx --proxy=http://username:password@host:port

7)升级pip

有时在安装python包时会提示pip版本过低:

Python包管理工具和多版本环境管理

这时需要升级pip版本,执行如下命令

 pip install --upgrade pip -vvv

1.5 Conda包管理

说到conda,就必须要说到anaconda了;

Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,拥有大量的用于科学计算的第三方库;

conda是anaconda的包管理和环境管理工具, 是 pip 和 vitualenv 的组合。强烈推荐

anaconda解决了Python开发者的两大痛点:

1)提供包管理,功能类似于 pip,Windows 平台安装第三方包经常失败的场景得以解决。

2)提供虚拟环境管理,功能类似于 virtualenv,解决了多版本Python并存问题。

安装时,会发现有两个不同版本的Anaconda,分别对应Python 2.7和Python 3.5,两个版本其实除了这点区别外其他都一样。后面我们会看到,安装哪个版本并不本质,因为通过环境管理,我们可以很方便地切换运行时的Python版本。

通过conda –help命令查看帮助

1)安装包

conda install -n python34 somepackage # -n 安装到指定环境;如果不用-n指定环境名称,则被安装在当前活跃环境;-c 指定通过某个channel安装

2)升级包

提示:pip只是一个包管理器,所以它不能为你管理环境。pip甚至不能升级python,因为它不像conda一样把python当做包来处理。但是它可以安装一些conda安装不了的包。

conda可以用来升级python,anaconda,conda,有木有感觉很强大

conda update -n python34 xxx        # 更新package
conda update conda # 更新conda,保持conda最新
conda update anaconda # 更新anaconda
conda update python # 更新python

3)删除包

conda remove -n python34 xxx

4)查询包

conda install xxxx    # 安装xxxx
conda list # 查看当前环境下已安装的包
conda list -n python34 # 查看某个指定环境的已安装包
conda search xxx # 查找package信息

5)修改镜像源

a)命令方式

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/        # 添加Anaconda的TUNA镜像,TUNA的help中镜像地址加有引号,需要去掉
conda config --set show_channel_urls yes # 设置搜索时显示通道地址

b)配置文件方式

修改 ~/.condarc (Linux/Mac) 或 C:\Users\当前用户名.condarc (Windows) 配置:

channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: yes

2. conda环境管理

2.1 conda多环境设置

主要用于解决多版本python共存的问题,同时针对不同的项目创建独立的开发环境;除了conda,其他主流的还有virtualenv和pyenv,但是我还是喜欢用conda

1)通过conda命令管理

# 创建一个名为python34的环境,指定Python版本是3.4(不用管是3.4.x,conda会为我们自动寻找3.4.x中的最新版本),新的开发环境会被默认安装在目录~/anaconda/envs下。你可以通过-h指定一个其他的路径;如果我们没有指定安装python的版本,conda会安装我们最初安装conda时所装的那个版本的python。
conda create –name python34 python=3.4
# 安装好后,使用activate激活某个环境
activate python34 # for Windows
source activate python34 # for Linux & Mac
# 激活后,会发现terminal输入的地方多了python34的字样,实际上,此时系统做的事情就是把默认2.7环境从PATH中去除,再把3.4对应的命令加入PATH
# 此时,再次输入
python--version
# 可以得到`Python 3.4.5 :: Anaconda 4.1.1 (64-bit)`,即系统已经切换到了3.4的环境
# 如果想返回默认的python 2.7环境,运行
deactivate python34 # for Windows
source deactivate python34 # for Linux & Mac
# 复制一个环境
conda create -n pyhon34 --clone python34clone
# 删除一个已有的环境
conda remove –name python34 --all
# 查看已安装的环境,当前被激活的环境会显示有一个星号或者括号
conda info -e

activate和deactivate效果如下:

Python包管理工具和多版本环境管理

2)pycharm

非常简单

Python包管理工具和多版本环境管理

设置环境名字,存放的位置以及环境安装的python版本

Python包管理工具和多版本环境管理

2.2 偷偷盗取一篇很牛逼的博文

关于conda和anaconda不可不知的误解和事实——conda必知必会

2012年发布的跨平台包管理软件conda,是在数据分析界和Numpy和Scipy一样受欢迎的python工具。但是普通程序员平时只是会使用conda安装一些第三方包, 对它从哪里来,它是什么,和它要到哪里去所知甚少。今天我们就要讲一下关于conda和anaconda不可不知的误解和事实——conda必知必会的那些事实。

误解 #1:Conda是python的一个发行版,不是一个包管理器。

事实: Conda是一个包管理器;Anaconda才是一个python发行版。虽然conda是用Anaconda打包的,但是它们两个的目标是完全不同的。

软件发行版是在系统上提前编译和配置好的软件包集合, 装好了后就可以直接用。包管理器是自动化软件安装,更新,卸载的一种工具。Conda,有命令”conda install”, “conda update”, “conda remove”, 所以很明显, conda是包管理器。

再来说说, Anaconda 和 Miniconda. Anaconda发行版会预装很多pydata生态圈里的软件,而Miniconda是最小的conda安装环境, 一个干净的conda环境。

但是,conda和Anaconda没有必然关系, 你可以不安装Anaconda的同时, 使用conda安装和管理软件。

误解 #2: Conda是一个python包管理器

事实:Conda是一个通用的包管理器,当初设计来管理任何语言的包。所以用来管理python包当然也是绰绰有余。

$ conda search –canonical | grep -v ‘py\d\d’

这句命令可以帮你找出不是 pip和virtualenv可以管理的python包,而conda可以管理

误解 #3: Conda 和 pip 是直接竞争关系

事实:Conda pip 目标并不相同,只有小部分子集有交集有竞争关系:比如python包的安装和环境隔离。 

一句话就可以看出区别:

pip可以允许你在任何环境中安装python包,而conda允许你在conda环境中安装任何语言包(包括c语言或者python)。

如果我们只是关注python包安装,conda和pip也是为不同用户和不同目标定制的。如果你想在一个已有系统快速管理python包,那你应该选择pip,因为conda应该在conda环境中使用,而pip鼓励在任何环境中使用 。而如果,你想要让许多依赖库一起很好地工作(比如数据分析中的Numpy,scipy,Matplotlib等等)那你就应该使用conda,conda很好地整合了包之间的互相依赖。

误解 #4: 使用conda首先是不负责任并且会引起分歧的

事实Conda作者多年来用python标准创造conda只有在非常清晰合理的时候才使用其他工具。

你可能会问,我相信conda是遵循python标准的,但是它们为什么偏偏要撇开pip自己去造一套包管理器呢?为什么他们不直接去pip团队贡献想法呢?

事实上,一开始conda那伙人是想在pip社区贡献想法和代码的,但是像numpy,scipy这样对底层c库有复杂依赖的包管理需求,真的不多,所以社区不接受这样的不常有的需求。所以,他们只能自己去造conda包管理器了。

误解 #5: conda不能和virtualenv一起使用,所以它对我的工作没用

事实上你可以在virtualenv环境下安装conda但是最好用conda自己的环境工具这样会和pip有更好的兼容性

你可以在virtualenv里面安装conda:

$ virtualenv test_conda
$ source test_conda/bin/activate
$ pip install conda
$ conda install numpy

也可以在conda中造虚拟环境:

$ conda create -n yourenvname python=x.x anaconda
$ source activate yourenvname

误解 #6: 现在pip用wheels了,conda没什么用了

事实:wheels只是解决了conda试图克服的许多困难中的一个, conda二进制编排还是有很多wheels没有的优势 

wheels和conda都解决了预编译的代码安装问题(不仅仅是源代码安装)。但是wheel没有conda的依赖处理能力,wheels只能跟踪python代码的依赖关系,conda可以跟踪很多c代码的依赖关系,这为许多用numpy和scipy做科学计算优化的科学家省了不少心。

误解 #7: conda不是开源的;它是被盈利公司掌控的,如果有一天公司想收费了,那你就得付钱

Reality: conda (the package manager and build system) is 100% open-source, and Anaconda (the distribution) is nearly there as well.

Anaconda和conda都是standard BSD license开源标准。如果你还不放心,用pip install conda吧,这是完全开源的。

误解 #8: Conda 软件包本身都是闭源的吧?

事实: 虽然conda默认渠道没有完全开源,但是有一个社区牵头的conda-forge,它会推动conda的包和发行版完全开源。

误解 #9: 但是,如果Continuum Analytics公司倒闭,conda就不会存活了吧 ?

事实: conda没有和Continuum Analytics公司有很多牵扯;公司为社区免费提供支持服务,所有软件都有负责人,而不是公司全权负责。

误解 #10: 每个人都应该抛弃(conda | pip)去用(pip | conda) !

事实: pip conda 是为不同目的存在的,我们应该更加关注怎么同时用好这两个工具,而不是只用一个

上一篇:python多版本以及各种包管理


下一篇:运用java集合Collections对List进行max和min操作