Spark SQL 入门
创建DataFrame
执行以下语句时
val df = spark.read.json("../examples/src/main/resources/people.json")
报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://localhost:9000/user/examples/src/main/resources/people.json
如下图所示:
问题原因:spark-shell 与 Hadoop集群管理器YARN集成,访问的是HDFS中的文件,需要把文件上传到HDFS中。
解决办法:
将/usr/spark/spark-3.0.0/examples/src/main/resources/people.json文件,复制到/usr/hadoop/hadoop-3.2.1/examples/src/main/resources文件夹下面。
使用以下命令上传到HDSF中:
// 创建文件夹
$ hadoop fs -mkdir /user/examples
$ hadoop fs -mkdir /user/examples/src
$ hadoop fs -mkdir /user/examples/src/main
$ hadoop fs -mkdir /user/examples/src/main/resources
// 上传文件
$ hadoop fs -moveFromLocal ../examples/src/main/resources/people.json /user/examples/src/main/resources/people.json
daqiang012 博客专家 发布了377 篇原创文章 · 获赞 127 · 访问量 64万+ 关注