前 言
Python数据分析
“数据分析是Python的杀手锏。”
——佚名
数据分析在自然科学、生物医学和社会科学领域有着悠久的历史。目前,如雷贯耳的大数据虽然尚没有严格的定义,但是它对数据分析工作的影响是毋庸置疑的。下面列举几个与大数据相关的趋势。
世界人口持续增长。
越来越多的数据被搜集和存储。
电脑芯片集成的晶体管数量不可能无限增长。
*、科学界、工业界和个人对数据洞察力的需求与日俱增。
随着数据科学的炒作,数据分析也呈现流行之势。与数据科学类似,数据分析也致力于从数据中提取有效信息。为此,我们需要用到统计学、机器学习、信号处理、自然语言处理和计算机科学领域中的各种技术。
在http://www.xmind.net/m/WvfC/页面上,可以找到一幅描绘与数据分析相关Python软件的脑图。首先要知道的是,Python生态系统已经非常完备,具有诸如NumPy、SciPy和matplotlib等著名的程序包。当然,这没有什么好奇怪的,因为Python自1989年就诞生了。Python易学、易用,并且与其他程序设计语言相比语法简练,可读性非常强,即使从未接触过Python的人,也可以在几天内掌握该语言的基本用法,对熟悉其他编程语言的人来说尤其如此。你无需太多的基础知识,就能顺畅地阅读本书。此外,关于Python的书籍、课程和在线教程也非常多。
目 录
第1章 Python程序库入门
1.1 本书用到的软件
1.2 从源代码安装NumPy、SciPy、matplotlib和Ipython
1.3 用setuptools安装
1.4 NumPy数组
1.5 一个简单的应用
1.6 将IPython用作shell
1.7 学习手册页
1.8 IPython notebook
1.9 从何处寻求帮助和参考资料
1.10 小结
第2章 NumPy数组
2.1 NumPy数组对象
2.2 创建多维数组
2.3 选择NumPy数组元素
2.4 NumPy的数值类型
2.5 一维数组的切片与索引
2.6 处理数组形状
2.7 创建数组的视图和拷贝
2.8 花式索引
2.9 基于位置列表的索引方法
2.10 用布尔型变量索引NumPy数组
2.11 NumPy数组的广播
2.12 小结
第3章 统计学与线性代数
第4章 pandas入门
第5章 数据的检索、加工与存储
第6章 数据可视化
第7章 信号处理与时间序列
第8章 应用数据库
第9章 分析文本数据和社交媒体
第10章 预测性分析与机器学习
第11章 Python生态系统的外部环境和云计算
第12章 性能优化、性能分析与并发性
附录A 重要概念
附录B 常用函数
附录C 在线资源