寒假记录5

2023-12-30 08:43:16

今天完成了实验任务三，主要学习了其中的Spark读取文件系统的数据。

在 spark-shell 中读取HDFS 系统文件“/user/hadoop/test.txt”（如果该文件不存在，请先创建），然后，统计出文件的行数；

scala>val textFile=sc.textFile("hdfs://localhost:9000/user/hadoop/test.txt") scala>textFile.count()

今天才看了爬虫作业的相关内容，这个作业进度有些晚了，日后我会加快脚步，努力赶上，今天只粗略地做了一下，感觉老师给的网址有一点不对劲，接下来再深入研究一下

码农公寓