随着线上越来越多的系统依赖Zookeeper集群。以至于Zookeeper集群的执行状况越来越重要。可是眼下还没有什么好用的Zookeeper集群监控系统(淘宝开源了一个Zookeeper监控系统,可是我认为非常不好用,里面主要有四个线程在跑,并且须要SSH登录到线上集群。这用起来非常不方便。)于是我们开发了一套Zookeeper集群监控程序。能够监控Zookeeper集群。
从官方文档我们能够了解到。监控Zookeeper集群能够用两种方法:
The ZooKeeper service can be monitored in one of two primary ways; 1) the command port through the use of 4 letter words and 2) JMX. See the appropriate section for your environment/requirements.
我这套系统就是基于方法一实现的。很多其它的详情能够參考官方文档。以下贴一下我们系统的图:
这是系统的菜单功能。分别包括了Zookeeper集群配置、集群监控、报警设置以及系统设置等功能。
这里列出了Zookeeper的所有机器的简单概括。点击IP能够进入到集群的简单概括。能够查看到集群是否执行正常等信息。例如以下图所看到的:
下图是某一详细机器的所有client连接详情:
下图是某一详细机器的所有监听文件夹的详情:
这是某一详细机器的图形化监控图: