Spark SQL 入门 创建DataFrame报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://local

Spark SQL 入门

创建DataFrame

执行以下语句时

val df = spark.read.json("../examples/src/main/resources/people.json")

报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://localhost:9000/user/examples/src/main/resources/people.json

如下图所示:

Spark SQL 入门 创建DataFrame报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://local

问题原因:spark-shell 与 Hadoop集群管理器YARN集成,访问的是HDFS中的文件,需要把文件上传到HDFS中。

解决办法:

将/usr/spark/spark-3.0.0/examples/src/main/resources/people.json文件,复制到/usr/hadoop/hadoop-3.2.1/examples/src/main/resources文件夹下面。
使用以下命令上传到HDSF中:

// 创建文件夹
$ hadoop fs -mkdir /user/examples
$ hadoop fs -mkdir /user/examples/src
$ hadoop fs -mkdir /user/examples/src/main
$ hadoop fs -mkdir /user/examples/src/main/resources
// 上传文件
$ hadoop fs -moveFromLocal ../examples/src/main/resources/people.json /user/examples/src/main/resources/people.json

 

Spark SQL 入门 创建DataFrame报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://localSpark SQL 入门 创建DataFrame报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://local daqiang012 博客专家 发布了377 篇原创文章 · 获赞 127 · 访问量 64万+ 他的留言板 关注
上一篇:“The subscription does not exist” when a distributor primary replica fails over to a replica that do


下一篇:【每天五分钟大数据-第一期】 伪分布式+Hadoopstreaming