- PySpark 大数据分析实用指南
- Spark 大规模机器学习
- Spark SQL 学习手册
- 精通 Spark 2.x 机器学习
- 精通 Spark 数据科学
- PySpark 秘籍
-
Scala 和 Spark 大数据分析
- 零、前言
- 一、Scala 简介
- 二、面向对象的 Scala
- 三、函数式编程概念
- 四、集合 API
- 五、应对大数据——Spark 来了
- 六、开始使用 Spark-REPL 和 RDD
- 七、RDD 特殊动作
- 八、小型结构简介——Spark SQL
- 九、传送我吧,史考提——Spark 流
- 十、一切都是连通的——GraphX
- 十一、学习机器学习——Spark MLlib 和 Spark ML
- 十二、高级机器学习最佳实践
- 十三、我叫贝叶斯,朴素的贝叶斯
- 十四、是时候整理一下了——使用 Spark MLlib 对你的数据聚类
- 十五、使用 SparkML 的文本分析
- 十六、Spark 调优
- 十七、该走向集群了——在集群上部署 Spark
- 十八、Spark 的测试和调试
- 十九、PySpark 和 SparkR
- 二十、使用 Alluxio 加速 Spark
- 二十一、ApacheZepplin 交互式数据分析
- Spark2 初学者手册
-
Spark2 数据处理和实时分析
- 零、前言
- 一、ApacheSpark V2 的首次尝试和新进展
- 二、ApacheSpark 流
- 三、结构化流
- 四、Apache Spark MLlib
- 五、ApacheSparkML
- 六、Apache 系统
- 七、Apache Spark GraphX
- 八、Spark 调优
- 九、Spark 的测试和调试
- 十、基于 Scala 的 Spark 实用机器学习
- 十一、Spark 的机器学习三大数据火枪手——完美结合
- 十二、实现健壮机器学习系统的通用方法
- 十三、可以随 Spark 扩展的推荐引擎
- 十四、基于 Apache Spark 2.0 的无监督聚类
- 十五、使用 Spark 2.0 ML 库实现文本分析
- 十六、Spark 流和机器学习库
- Spark 2.x 机器学习秘籍
- Spark 深度学习秘籍
- 使用 Storm 构建 Python 实时应用
- Python 数据科学与机器学习实用手册
- 精通 Spark
- 精通 Storm
- Spark 机器学习
- 大数据分析实战
- Spark 秘籍
- 面向 Python 开发者的 Spark
- Storm 蓝图
- Flink 学习手册
- Kafka 学习手册中文第二版
- Storm 和 Cassandra 实时分析
- Spark 数据科学
下载
Docker
docker pull apachecn0/apachecn-bigdata-zh
docker run -tid -p <port>:80 apachecn0/apachecn-bigdata-zh
# 访问 http://localhost:{port}
PYPI
pip install apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 访问 http://localhost:{port}
NPM
npm install -g apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 访问 http://localhost:{port}
贡献指南
本项目需要校对,欢迎大家提交 Pull Request。
请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自*)
组织介绍
赞助我们
通过平台自带的打赏功能,或点击这里。