06RDD

一、词频统计

1.读文本文件生成RDD lines

2.将一行一行的文本分割成单词 words flatmap()

3.全部转换为小写 lower()

4.去掉长度小于3的单词 filter()

5.去掉停用词

6.转换成键值对 map()

7.统计词频 reduceByKey()

8.按字母顺序排序 sortBy(f)

9.按词频排序 sortByKey()

 06RDD

 06RDD

 06RDD

 06RDD

 06RDD

06RDD

 06RDD

 06RDD

 06RDD

 

map(), distinct(), count()

06RDD

06RDD

map(), countByKey()

06RDD

map(), countByValue()

06RDD

filter(), map() RDD

06RDD

map(),lookup()  list

06RDD

filter(), map(), sortBy()

map(),lookup(),mean()

06RDD

上一篇:linux内核hook技术之函数地址替换


下一篇:浅谈Spring中@lookup注解