概述
使用 python 做数据分析,目前最方便和最流行的环境就是 Anaconda。
Anaconda 太重,刚开始学习使用 python 数据分析,还是觉得 Miniconda 更好一些。
环境安装
我是在 Debian10 下使用 python,所以下载了最新的 Linux 下的安装脚本:
$ wget https://repo.anaconda.com/miniconda/Miniconda3-py39_4.9.2-Linux-x86_64.sh
$ ./Miniconda3-py39_4.9.2-Linux-x86_64.sh
下载安装脚本之后,直接执行即可。 执行过程根据提示,设置安装路径,之后安装的 python package 都会在这个安装路径下。
设置是否自动启动
设置自动启动的话,进入 shell 就进入 miniconda 环境。 建议不要自动启动,因为后续可能有多个 miniconda 环境。
$ conda config --set auto_activate_base false
基本使用
创建环境
$ conda create --name databook
创建一个名称为 databook 的环境。 这里环境的概念和之前 python 的 virtualenv 差不多,就是为了将 python 环境和系统自带的 python 环境隔离开来。
创建的环境位于:
$ ll /path/to/miniconda3/envs
total 4.0K
drwxr-xr-x 20 wangyubin wangyubin 4.0K Jan 17 00:15 databook
进入/退出环境
# 进入 databook 环境
$ conda activate databook
# 退出 databook 环境
$ conda deactivate databook
安装 python package
进入 databook 环境之后,安装常用的 python 数据分析 package
$ conda activate databook
$ conda install ipython
$ conda install numpy
$ conda install pandas
$ conda install matplotlib
$ conda install scikit-learn
这些常用的 package 后续在实战中再介绍使用。
安装的 package 都在相应的环境目录中:
$ ls /path/to/miniconda3/envs/databook/lib/python3.9/site-packages