hadoop各个组件功能

HDFS 分布式文件系统

YARN 资源管理系统

MapReduce 分布式计算框架

ZooKeeper分布式协调服务

Hbase分布式数据库

Flume 日志收集

Sqoop 数据同步工具

Oozie 作业流调度系统

Ambari 安装部署工具

Hive基于MR的数据仓库

Mahout 数据挖掘库

Pig数据分析系统


计算框架:

MapReduce 离线计算

Tez DAG计算

Spark 内存计算

storm 实时计算


数据分析系统

Hive基于MR的数据仓库

Pig数据分析系统


Hadoop作业流调度引擎

Oozie 

Azkaban 




本文转自 corasql 51CTO博客,原文链接:http://blog.51cto.com/corasql/1738114,如需转载请自行联系原作者
上一篇:2017年勒索软件、物联网攻击将继续肆虐


下一篇:什么情况下不能使用 Java 泛型