简介
PySpark SQL Recipes:使用HiveQL,Dataframe和Graphframes Pdf
使用问题解决方案方法,使用PySpark SQL,图形框架和图形数据处理进行数据分析。本书提供了与数据框架,数据操作摘要和探索性分析相关的问题的解决方案。您将使用图形框架提高图形数据分析的技能,并了解如何优化PySpark SQL代码。
PySpark SQL Recipes首先介绍了使用PySpark SQL创建来自不同类型数据源,数据聚合和汇总以及探索性数据分析的数据帧的方法。您还将了解如何使用图框来解决图分析中的问题。
完成本书后,您将拥有所有PySpark SQL任务的现成代码,包括使用来自不同文件格式以及SQL或NoSQL数据库的数据创建数据帧。
参考资料
- 下载:https://www.jianshu.com/p/8e3132c4a92d
- python测试开发项目实战-目录
- 本文涉及的python测试开发库 谢谢点赞!
- 本文相关海量书籍下载
- 2018最佳人工智能机器学习工具书及下载(持续更新)
- Format Pdf
- Page Count 343 Pages
- https://github.com/Apress/pyspark-recipes 2019-04 14+星
你会学到什么
- 了解PySpark SQL及其高级功能
- 在PySpark SQL中使用SQL和HiveQL
- 使用结构化流媒体
- 优化PySpark SQL
- 掌握图形框架和图形处理
本书对象
数据科学家,Python程序员和SQL程序员。