- Hadoop MapReduce只支持批处理任务,无法支持流式任务
- Apache Tez
支持批处理任务,只是使用DAG来组织MR任务。
- Apache Storm
只支持流式的处理任务,无法支持批处理任务
- Apache Spark支持批处理任务,在此基础上,通过Spark Streaming采用Micro-Batch的架构,把数据流切分成细粒度的批处理,并作为一个Spark任务,它不是原生的流处理。
- Apache Flink
原生支持流式处理,通过缓存块的设计实现流和批的统一。
相关文章
- 12-18ENode框架单台机器在处理Command时的设计思路
- 12-18大数据处理相关框架对比
- 12-18Android Retrofit 2 0框架上传图片解决方案(一张与多张的处理)
- 12-18文字识别OCR开源框架的对比--Tesseract vs EasyOCR
- 12-18哈,我自己翻译的小书,马上就完成了,是讲用python处理大数据框架hadoop,spark的
- 12-18EF框架 对字段属性为NULL的空值处理 类型前面加上?保证EF列表读取显示数据不会报异常
- 12-18流计算框架 Flink 与 Storm 的性能对比
- 12-189.一套简单的全局错误处理框架,工作中直接拿来可用
- 12-18几款流行的开源服务器框架对比:et / kbengine / skynet
- 12-18为什么要用Hibernate框架? 把SessionFactory,Session,Transcational封装成包含crud的工具类并且处理了事务,那不是用不着spring了?