spark（19）sparksql概述及其四大特性

2024-03-11 17:52:31

sparksql概述

Spark SQL is Apache Spark's module for working with structured data.

SparkSQL是apache Spark用来处理结构化数据的一个模块。

将SQL查询与Spark程序无缝混合

可以使用不同的语言进行代码开发

以相同的方式连接到任何数据源，sparksql后期可以采用一种统一的方式去对接任意的外部数据源，不需要使用不同的Api

val  dataFrame = sparkSession.read.文件格式的方法名("该文件格式的路径")

sparksql可以支持hivesql这种语法 sparksql兼容hivesql

sparksql支持标准的数据库连接JDBC或者ODBC