数据工具汇总
01 - NumPy
HomePage:http://www.numpy.org/
NumPy(数值 Python 的简称)是用Python实现的用于科技计算的基础软件包,是一个强大的科学分析和建模工具
- 提供了大量数据结构,能够轻松地执行多维数组和矩阵运算
- 可用作不同类型通用数据的多维容器
- 可以和其他编程语言无缝集成
- 可以简单而快速地与大量数据库和工具结合
官方文档 - NumPy
- HomePage:http://www.numpy.org/
- Manual:https://docs.scipy.org/doc/numpy/
- User Guide:https://docs.scipy.org/doc/numpy/user/
- Reference:https://docs.scipy.org/doc/numpy/reference/generated/
- Function Index:https://docs.scipy.org/doc/numpy/genindex.html
02 - Pandas
HomePage:http://pandas.pydata.org/
针对Python语言的开源数据分析处理工具,可以提供高性能、易用的数据结构;
官方文档 - Pandas
- Docs: http://pandas.pydata.org/pandas-docs/stable/index.html
- Function Index:http://pandas.pydata.org/pandas-docs/stable/genindex.html
- API:http://pandas.pydata.org/pandas-docs/stable/api.html
- Tutorials:http://pandas.pydata.org/pandas-docs/stable/tutorials.html
- 10 Minutes to pandas:http://pandas.pydata.org/pandas-docs/stable/10min.html
- Cookbook:http://pandas.pydata.org/pandas-docs/stable/cookbook.html
03 - Matplotlib
HomePage:https://matplotlib.org/
Python语言的绘图库,功能强大,可绘制出各种专业的图像,支持各种平台,可实现定制;
官方文档 - Matplotlib
- Docs : https://matplotlib.org/contents.html
- Examples:https://matplotlib.org/gallery/index.html
- Tutorials:https://matplotlib.org/tutorials/index.html
- API:https://matplotlib.org/api/
- User Guide:https://matplotlib.org/contents.html
- Function Indexing:https://matplotlib.org/genindex.html
- Python Module Index:https://matplotlib.org/py-modindex.html
04 - StatsModels
HomePage:http://www.statsmodels.org/
Statsmodels is a Python module that provides classes and functions for the estimation of many different statistical models, as well as for conducting statistical tests, and statistical data exploration.
- 提供强大的数据统计、测试、探索、分析、建模和可视化功能
- 利用Pandas对象作为基础数据容器进行计算
- 包含一些经典的统计方法,比如贝叶斯方法和一个机器学习的模型
官方文档 - StatsModels
- Documentation:https://www.statsmodels.org/stable/index.html
- Getting started:http://www.statsmodels.org/stable/gettingstarted.html
- Examples:http://www.statsmodels.org/stable/examples/index.html
- Index - Module:http://www.statsmodels.org/stable/py-modindex.html
- Index - Function:http://www.statsmodels.org/stable/genindex.html
其他 - StatsModels
导入statsmodels.api时,出现类似“No module named 'patsy'”的报错
import statsmodels.api as sm
ModuleNotFoundError: No module named 'patsy'
确认当前环境是否已安装patsy模块。
05 - Seaborn
HomePage:https://seaborn.pydata.org/
Seaborn is a Python data visualization library based on matplotlib.
It provides a high-level interface for drawing attractive and informative statistical graphics.
官方文档 - Seaborn
- Introduction:http://seaborn.pydata.org/introduction.html
- Tutorial:http://seaborn.pydata.org/tutorial.html
- Index:http://seaborn.pydata.org/examples/index.html
- API:http://seaborn.pydata.org/api.html
06 - Pyecharts
HomePage:http://pyecharts.org/
Pyecharts是一款将python与echarts结合的强大的数据可视化工具
官方文档 - Pyecharts
- Documentation:http://pyecharts.org/#/zh-cn/