昨天与大家分享了最值得一读的机器学习免费书籍。这次,雷锋网再为大家呈上数据科学领域的相关图书、教程。仍然是正版免费,仍然是英文原著,部分有汉语译本。
本列表不分先后次序。
█《Foundations of Data Science》
作者:John Hopcroft, Ravindran Kannan
未出版的教学笔记。正在学习数据科学理论课程的童鞋,这本书是一个不错的补充。
█《UFLDL Tutorial》
作者:吴恩达, Jiquan Ngiam, Chuan Yu Foo, Yifan Mai, Caroline Suen
吴老师等斯坦福学者整理的教程, 讲解无监督特征学习和深度学习的主要概念,以及相关算法的实现和应用。需要基础机器学习知识。吴老师建议修完他的 Coursera 机器学习公开课再来读这个。
地址:http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial
█《Python Data Science Handbook》
作者:Jake VanderPlas
书如其名,介绍用 Python 进行数据开发的主流工具库,包括 IPython, NumPy, Pandas, Matplotlib, Scikit-Learn。 O'Reilly Media 出版。
地址:https://github.com/jakevdp/PythonDataScienceHandbook
█《Hands-On Machine Learning and Big Data》
作者:Kareem Alkaseer
这本以墙皮为封面的书,是理解机器学习和大数据基本概念的好去处,包含大量代码示例。
地址:https://www.gitbook.com/book/kalkaseer/hands-on-ml-and-bigdata/details
█《Think Stats》
作者:Allen B. Downey
针对 Python 开发者的概率论和统计学入门。这本书十分强调用于现实中数据集的简单实用技巧。O'Reilly 的“Think X”系列,是帮助有编程基础的开发者进行跨界学习的不错资源,程序猿可多关注。该系列基本都有中文译本,本书名为《统计思维》。
地址:http://greenteapress.com/thinkstats/
█《Think Bayes》
作者: Allen B. Downey
从计算方法角度对贝叶斯统计的入门介绍。同样是 O'Reilly“Think X”系列(雷锋网注:感谢下 O'Reilly 的分享精神),同样对程序员友好:使用 Python 代码而不是数学,使用 discrete approximations 而非 continuous mathematics。中文译版名为《贝叶斯思维》 。
地址:http://greenteapress.com/wp/think-bayes/
█《Convex Optimization》
作者:Stephen Boyd,Lieven Vandenberghe
如书名,对该领域做了比较全面的综合介绍。至于如何高效地用算术方面解决这类问题,书中有许多细节。这本书是剑桥大学出版社出版,但在网上免费分享(好吧,剑桥中国史卖那么贵我就不吐槽了)。中文版《凸优化》可在主流书商买到。
地址:http://stanford.edu/~boyd/cvxbook/
█《Essentials of Metaheuristics》
作者:Sean Luke
作者是教这门课的教授,这是他根据课程编写的笔记,面向本科生、开发者、程序员、或其他需要打基础的人。作者将这本书免费分享,雷锋网获知,他希望大家在其网站上填一份个人信息表格再下载。
地址:https://cs.gmu.edu/~sean/book/metaheuristics/
在上述书籍之外,倒还有几本不错的机器学习和统计领域的免费电子书。但雷锋网(公众号:雷锋网)此前盘点过的,本文不再重复。请参考此前文章:最近很火的《计算机科学的数学》是本什么样的书?。
另外,更全面的机器学习外文书籍盘点,请看:机器学习漫游指南 最完整的入门书单(外文版)。