yarn的工作执行流程图
1、用户向YARN中提交应用程序
2、ResourceManager为该应用程序找到一个可用的NodeManager 并分配一个Container,然后在这个Container中启动应用程序的ApplicationMaster。
3、ApplicationMaster向ResourceManager进行注册,这样用户就可以通过ResourceManager查看应用程序的运行状态并对任务进行监控。
4、ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager 申请和领取资源。
5、ApplicationMaster申请到资源后与对应的NodeManager通信,要求他启动Container并为任务设置好运行环境。
6、应用程序的任务开始在启动的Container中运行,各个任务向ApplicationMaster汇报自己的状态和进度,以便ApplicationMaster随时掌握各个任务
的运行状态,从而可以在任务失败时重新启动任务。
7、应用在运行的过程中,客户端通过轮询的方式主动与ApplicationMaster通信以获得应用的运行状态、执行进度等信息
8、应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己。