003.windows下启动运行spark-spark-shell.cmd

解压文件

D:\bigdata\spark2.1.0\spark-2.1.0-bin-hadoop2.7\bin

创建文件

003.windows下启动运行spark-spark-shell.cmd

 

 

spark scala
hadoop scala
scala spark
hive hadoop

 

bin目录下

spark-shell.cmd

 

读文件处理文件

scala> sc.textFile("file:///D:/bigdata/spark2.1.0/spark-2.1.0-bin-hadoop2.7/bin/input/word.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect
res5: Array[(String, Int)] = Array((scala,3), (hive,1), (spark,1), (hadoop,2), (saprk,1))

 

003.windows下启动运行spark-spark-shell.cmd

上一篇:windows-git-tagslist


下一篇:微信是什么? 你如何用微信决定了它到底是什么