Zookeeper(三)选举机制

必要小知识:

  1)SID:服务武器ID。用来唯一标识服务器的id,和myid文件中的一致。

  2)ZXID:事务ID。ZXID是一个事务ID,用来标识一次服务器状态的变更。在某一时刻,集群中的每台机器的ZXID不一定完全一致,和Zookeeper服务器对客户端的“更新请求”的处理逻辑有关。

  3)Epoch:每个Leader任期的代号。没有Leader时同一轮投票过程中的逻辑时钟值是相同的。每投完一轮票这个数据就会增加。

第一次启动时:

  Zookeeper(三)选举机制

  1)服务器1启动,发动一次选举。服务器1投自己一票。此时服务器1只有1票,没有半数以上(3票),选举无法完成,服务器1状态保持为LOOKING

  2)服务器2启动,再发动一次选取。服务器1和服务器2分别投自己一票并交换选票信息:此时服务器1发现服务器2的myid比自己目前投票推举的(服务器1)大,更改选票为推举服务器2。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1和服务器2状态保持LOOKING

  3)服务器3启动,发动一次选举。此时服务器1和服务器2都会更改选票为服务器3。此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数超过半数,服务器3当选Leader。服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING

  4)服务器4启动,发起一次选举。此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息为:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票为服务器3,并更改状态为FOLLOWING。

  5)服务器5启动,同4一样当小弟。

非第一次启动:

Zookeeper(三)选举机制

  1)但Zookeeper集群中的一台服务器出现以下情况,会进入Leader选举:

    i.服务器初始化启动

    ii.服务器运行期间无法和Leader保持连接

  2)当一台机器进行Leader选举流程时,当前集群可能会处于以下两种状态:

    i.集群中本来就已经存在一个Leader。

       对于第一种已经存在Leader的情况,机器试图去选举Leader时,会被告知当前服务器的Leaderr信息,对于该机器来说,仅仅需要和Leader机器建立连接,并进行状态同步即可。

    ii.集群中确实不存在Leader

      假如Zookeeper由5台服务器组成,SID分别为(1,2,3,4,5),ZXID分为别(8,8,8,7,7),并且此时SID是3的服务器是Leader。某一时刻,3和5服务器发生故障,因此开始Leader选举:

                    (EPOCH, ZXID, SID)  (EPOCH, ZXID, SID)  (EPOCH, ZXID, SID)

      SID为1、2、4的选举情况   (1, 8, 1)      (1, 8, 2)       (1, 8, 4)

        选举Leader规则:1.EPOCH大的直接胜出

                2.EPOCH相同,事务id大的胜出

                3.事务id相同,服务器id大的胜出

上一篇:kafka消息丢失


下一篇:kafka消息一致性