整个Hadoop框架工作流程

   HDFS文件存储系统,负责文件的上传与下载,包含NameNode(一个)和DataNode(多个)两个部分,其中,NameNode存储的是源文件,即文件的存放位置,根据这个位置定位到节点;而DataNode才是真正负责存储数据文件的节点;

   mapreduce 计算工作任务,包含整个map阶段和reduce阶段以及其中系统的shuffle过程;

   yarn资源调度管理器,负责mapreduce工作任务的调度和命令的下达,他包含ResourceManagerNodeManager两个进程。其中,ResourceManage根据各节点的存储和工作情况来进行新任务的资源调度,而NodeManager则负责任务的命令下达。

上一篇:HDFS优缺点及解决方案


下一篇:Hadoop配置文件详解