前置知识
算法和数据的辩证关系:算法和数据是机器学习解决实际问题不可或缺的两大因素。早期机器学习十分依赖特征提取,随着发展,人们发现通过增加训练数据量,让机器从大量基础特征中可以自动关联出潜在关系,自动学习出更高级的特征;
深度学习框架:paddle(百度开源),tensorflow(谷歌团队开发维护);
Python几个重点库:NumPy,SciPy,NTLK,Scikit-Learn。
Py库安装
Numpy
介绍:
NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
一个强大的N维数组对象 ndarray
广播功能函数
整合 C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能
安装:
anaconda的spyder自带
SciPy
介绍:
SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包。
它包括统计、优化、涉及线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等众多数学包。
安装:
anaconda的spyder自带
NLTK
介绍:
Natural Language Toolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库。
安装:
在anaconda prompt 命令窗口里输入:pip install nltk
Scikit-Learn
介绍:
机器学习算法库。可以实现数据预处理,分类,回归,降维,模型选择等常用的机器学习算法。
依赖.python(>=2.6 or >=3.3) .NumPy(>=1.6.1) .SciPy(>=0.9)
安装:
在anaconda prompt 命令窗口里输入:pip install scikit-learn。
Tensorflow虚拟环境搭建
TensorFlow目前在windows下只支持python 3.5版本。
(1)打开Anaconda Prompt,输入清华仓库镜像,这样更新会快一些:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
(2)同样在Anaconda Prompt中利用Anaconda创建一个python3.5的环境,环境名称为tensorflow ,输入下面命令:
conda create -n tensorflow python=3.5
运行 开始菜单->Anaconda3—>Anaconda Navigator
,点击左侧的Environments
,可以看到tensorflow
的环境已经创建好了。
(3)在Anaconda Prompt中启动tensorflow环境:
activate tensorflow
当不使用tensorflow时,关闭tensorflow环境,命令为:deactivate