机器学习常用工具库

Pandas
来源:https://www.pypandas.cn/

Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

numpy
来源:https://www.numpy.org.cn/。
来源:https://www.runoob.com/numpy/numpy-tutorial.html

Matplotlib 入门教程
http://www.inimei.cn/archives/593.html
SciPy
来源:https://zh.wikipedia.org/wiki/SciPy

SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。与其功能相类似的软件还有MATLAB、GNU Octave和Scilab。

sklearn
SciKit learn的简称是SKlearn,是一个开源的python库,专门用于机器学习、数据挖掘和数据分析的模块。它建立在 NumPy ,SciPy 和 matplotlib 上。

https://www.zhihu.com/question/53740695
https://scikit-learn.org/stable/tutorial/basic/tutorial.html

Tensorflow和Caffe、MXNet等是针对深度学习特制的工具包,而Scikit-learn是对传统的机器学习,包括预处理,特征工程,模型构建,验证等的完整实现。这两类工具压根不是做同一件事的。

总的来说学习库的最好方式就是直接看官方文档。

深度学习框架
caffe
来源:https://zh.wikipedia.org/wiki/Caffe

Convolutional Architecture for Fast Feature Embedding)是一个深度学习框架,最初开发于加利福尼亚大学伯克利分校。Caffe在BSD许可下开源,使用C++编写,带有Python接口[4][5]。

pyTorch
来源:https://zh.wikipedia.org/wiki/PyTorch

tensorflow
来源:http://www.tensorfly.cn/

TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。

上一篇:完美解决AttributeError: module 'scipy.misc' has no attribute 'imread'报错问题


下一篇:使用自定义约束实现Python解算器