《Spark大数据分析实战》——导读

本节书摘来自华章社区《Spark大数据分析实战》一书中的目录,作者高彦杰 倪亚宇,更多章节内容可以访问云栖社区“华章社区”公众号查看


《Spark大数据分析实战》——导读

目  录

前 言
第1章 Spark简介
1.1 初识Spark
1.2 Spark生态系统BDAS
1.3 Spark架构与运行逻辑
1.4 弹性分布式数据集
1.5 本章小结
第2章 Spark开发与环境配置
2.1 Spark应用开发环境配置
2.2 远程调试Spark程序
2.3 Spark编译
2.4 配置Spark源码阅读环境
2.5 本章小结
第3章 BDAS简介
3.1 SQL on Spark
3.2 Spark Streaming
3.3 GraphX
3.4 MLlib
3.5 本章小结
第4章 Lamda架构日志分析流水线
4.1 日志分析概述
4.2 日志分析指标
4.3 Lamda架构
4.4 构建日志分析数据流水线
4.5 本章小结
第5章 基于云平台和用户日志的推荐系统
5.1 Azure云平台简介
5.2 系统架构
5.3 构建Node.js应用
5.4 数据收集与预处理
5.5 Spark Streaming实时分析用户日志
5.6 MLlib离线训练模型
5.7 本章小结
第6章 Twitter情感分析
6.1 系统架构
6.2 Twitter数据收集
6.3 数据预处理与Cassandra存储
6.4 Spark Streaming热点Twitter分析
6.5 Spark Streaming在线情感分析
6.6 Spark SQL进行Twitter分析
6.7 Twitter可视化
第7章 热点新闻分析系统
7.1 新闻数据分析
7.2 系统架构
7.3 爬虫抓取网络信息
7.4 新闻文本数据预处理
7.5 新闻聚类
7.6 Spark Elastic Search构建全文检索引擎
7.7 本章小结
第8章 构建分布式的协同过滤推荐系统
8.1 推荐系统简介
8.2 协同过滤介绍
8.3 基于Spark的矩阵运算实现协同过滤算法
8.4 基于Spark的MLlib实现协同过滤算法
8.5 案例:使用MLlib协同过滤实现电影推荐
8.6 本章小结

上一篇:iOS剪切板UIPasteboard开发应用解析(二)


下一篇:MySQL-5.7组提交(Group Commit)原理