ML学习笔记(1)初识Anaconda

本文仅从小萌新视角记录ML学习过程

ML一直以来都是我心驰神往的领域,初涉其中,不免困惑,如同走进一个巨大的迷宫,找不到出口。

首先记录我的各种问题及我自己尝试找到的答案

1.Anaconda是啥?很多人常提起。

早有耳闻。转载自https://www.jianshu.com/p/169403f7e40c

conda 是开源包(packages)和虚拟环境(environment)的管理系统。

  • packages 管理: 可以使用 conda 来安装、更新 、卸载工具包 ,并且它更关注于数据科学相关的工具包。在安装 anaconda 时就预先集成了像 Numpy、Scipy、 pandas、Scikit-learn 这些在数据分析中常用的包。另外值得一提的是,conda 并不仅仅管理Python的工具包,它也能安装非python的包。比如在新版的 Anaconda 中就可以安装R语言的集成开发环境 Rstudio。

  • 虚拟环境管理: 在conda中可以建立多个虚拟环境,用于隔离不同项目所需的不同版本的工具包,以防止版本上的冲突。对纠结于 Python 版本的同学们,我们也可以建立 Python2 和 Python3 两个环境,来分别运行不同版本的 Python 代码。

相信大多数 Python 的初学者们都曾为环境问题而头疼不已。

为了在入门时少走弯路,并且让高涨的积极性不至于太受打击,推荐使用 Anaconda 来管理安装环境和各种工具包。

根据提示进行安装,完成后你大概会惊讶地发现电脑中多了好多应用,不用担心,我们一项项来看:

  • Anaconda Navigator :用于管理工具包和环境的图形用户界面,后续涉及的众多管理命令也可以在 Navigator 中手工实现。
  • Jupyter notebook :基于web的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程。
  • qtconsole :一个可执行 IPython 的仿终端图形界面程序,相比 Python Shell 界面,qtconsole 可以直接显示代码生成的图形,实现多行代码输入执行,以及内置许多有用的功能和函数。
  • spyder :一个使用Python语言、跨平台的、科学运算集成开发环境。

如何管理Python包?

安装一个 package:

conda install package_name

这里 package_name 是需要安装包的名称。你也可以同时安装多个包,比如同时安装numpy 、scipy 和 pandas,则执行如下命令:

conda install numpy scipy pandas

你也可以指定安装的版本,比如安装 1.1 版本的 numpy :

conda install numpy=1.10

移除一个 package:

conda remove package_name

升级 package 版本:

conda update package_name

查看所有的 packages:

conda list

如果你记不清 package 的具体名称,也可以进行模糊查询:

conda  search search_term

如何管理Python环境?

默认的环境是 root,你也可以创建一个新环境:

conda create -n env_name  list of packages

其中 -n 代表 name,env_name 是需要创建的环境名称,list of packages 则是列出在新环境中需要安装的工具包。

例如,当我安装了 Python3 版本的 Anaconda 后,默认的 root 环境自然是 Python3,但是我还需要创建一个 Python 2 的环境来运行旧版本的 Python 代码,最好还安装了 pandas 包,于是我们运行以下命令来创建:

conda create -n py2 python=2.7 pandas 

细心的你一定会发现,py2 环境中不仅安装了 pandas,还安装了 numpy 等一系列 packages,这就是使用 conda 的方便之处,它会自动为你安装相应的依赖包,而不需要你一个个手动安装。

进入名为 env_name 的环境:

source activate env_name

退出当前环境:

source deactivate

另外注意,在 Windows 系统中,使用 activate env_namedeactivate 来进入和退出某个环境。

删除名为 env_name 的环境:

conda env remove -n env_name

显示所有的环境:

conda env list

当分享代码的时候,同时也需要将运行环境分享给大家,执行如下命令可以将当前环境下的 package 信息存入名为 environment 的 YAML 文件中。

conda env export > environment.yaml

同样,当执行他人的代码时,也需要配置相应的环境。这时你可以用对方分享的 YAML 文件来创建一摸一样的运行环境。

conda env create -f environment.yaml

总结:Anaconda是ML学习过程中的得力帮手,要熟练使用这把利器!

上一篇:2021,精选 App 帮你开启新的一年


下一篇:ML基础 | 一文详解正态分布(附python实现)