必要小知识:
1)SID:服务武器ID。用来唯一标识服务器的id,和myid文件中的一致。
2)ZXID:事务ID。ZXID是一个事务ID,用来标识一次服务器状态的变更。在某一时刻,集群中的每台机器的ZXID不一定完全一致,和Zookeeper服务器对客户端的“更新请求”的处理逻辑有关。
3)Epoch:每个Leader任期的代号。没有Leader时同一轮投票过程中的逻辑时钟值是相同的。每投完一轮票这个数据就会增加。
第一次启动时:
1)服务器1启动,发动一次选举。服务器1投自己一票。此时服务器1只有1票,没有半数以上(3票),选举无法完成,服务器1状态保持为LOOKING
2)服务器2启动,再发动一次选取。服务器1和服务器2分别投自己一票并交换选票信息:此时服务器1发现服务器2的myid比自己目前投票推举的(服务器1)大,更改选票为推举服务器2。此时服务器1票数0票,服务器2票数2票,没有半数以上结果,选举无法完成,服务器1和服务器2状态保持LOOKING
3)服务器3启动,发动一次选举。此时服务器1和服务器2都会更改选票为服务器3。此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数超过半数,服务器3当选Leader。服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING
4)服务器4启动,发起一次选举。此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息为:服务器3为3票,服务器4为1票。此时服务器4服从多数,更改选票为服务器3,并更改状态为FOLLOWING。
5)服务器5启动,同4一样当小弟。
非第一次启动:
1)但Zookeeper集群中的一台服务器出现以下情况,会进入Leader选举:
i.服务器初始化启动
ii.服务器运行期间无法和Leader保持连接
2)当一台机器进行Leader选举流程时,当前集群可能会处于以下两种状态:
i.集群中本来就已经存在一个Leader。
对于第一种已经存在Leader的情况,机器试图去选举Leader时,会被告知当前服务器的Leaderr信息,对于该机器来说,仅仅需要和Leader机器建立连接,并进行状态同步即可。
ii.集群中确实不存在Leader
假如Zookeeper由5台服务器组成,SID分别为(1,2,3,4,5),ZXID分为别(8,8,8,7,7),并且此时SID是3的服务器是Leader。某一时刻,3和5服务器发生故障,因此开始Leader选举:
(EPOCH, ZXID, SID) (EPOCH, ZXID, SID) (EPOCH, ZXID, SID)
SID为1、2、4的选举情况 (1, 8, 1) (1, 8, 2) (1, 8, 4)
选举Leader规则:1.EPOCH大的直接胜出
2.EPOCH相同,事务id大的胜出
3.事务id相同,服务器id大的胜出