189 Spark Streaming概述

189 Spark Streaming概述
Spark Streaming类似于Apache Storm,用于流式数据的处理。根据其官方文档介绍,Spark Streaming有高吞吐量和容错能力强等特点。Spark Streaming支持的数据输入源很多,例如:Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算。而结果也能保存在很多地方,如HDFS,数据库等。另外Spark Streaming也能和MLlib(机器学习)以及Graphx完美融合。

189 Spark Streaming概述

Spark Streaming特点

1.易用
189 Spark Streaming概述
2.容错
189 Spark Streaming概述
3.易整合到Spark体系

189 Spark Streaming概述

 

上一篇:194 Spark Streaming实现实时WordCount


下一篇:开源至上:华为4面技术5面HR