由于Spark是在Hadoop家族之上发展出来的,因此底层为了兼容hadoop,支持了多种的数据格式。如S3、HDFS、Cassandra、HBase,有了这些数据的组织形式,数据的来源和存储都可以多样化~
相关文章
- 02-13Spark入门,概述,部署,以及学习(Spark是一种快速、通用、可扩展的大数据分析引擎)
- 02-13spark基本概念(便于自己随时查阅--摘自Spark快速大数据分析)
- 02-13Spark使用Java读取mysql数据和保存数据到mysql
- 02-13Spark入门,概述,部署,以及学习(Spark是一种快速、通用、可扩展的大数据分析引擎)
- 02-13[spark 快速大数据分析读书笔记] 第一章 导论
- 02-13Spark(十二)【SparkSql中数据读取和保存】
- 02-13《Spark与Hadoop大数据分析》——1.1 大数据分析以及 Hadoop 和 Spark 在其中承担的角色
- 02-13Spark(十二)【SparkSql中数据读取和保存】
- 02-13《Spark快速大数据分析》—— 第五章 数据读取和保存
- 02-13《Spark与Hadoop大数据分析》——3.6 Spark 资源管理器:Standalone、YARN和Mesos