Spark SQL 入门
创建DataFrame
执行以下语句时
val df = spark.read.json("../examples/src/main/resources/people.json")
报错:org.apache.spark.sql.AnalysisException: Path does not exist: hdfs://localhost:9000/user/examples/src/main/resources/people.json
如下图所示:
问题原因:spark-shell 与 Hadoop集群管理器YARN集成,访问的是HDFS中的文件,需要把文件上传到HDFS中。
解决办法:
将/usr/spark/spark-3.0.0/examples/src/main/resources/people.json文件,复制到/usr/hadoop/hadoop-3.2.1/examples/src/main/resources文件夹下面。
使用以下命令上传到HDSF中:
// 创建文件夹
$ hadoop fs -mkdir /user/examples
$ hadoop fs -mkdir /user/examples/src
$ hadoop fs -mkdir /user/examples/src/main
$ hadoop fs -mkdir /user/examples/src/main/resources
// 上传文件
$ hadoop fs -moveFromLocal ../examples/src/main/resources/people.json /user/examples/src/main/resources/people.json
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。