ZooKeeper并没有直接采用Paxos算法,而是采用一种被称为ZAB(ZooKeeper Atomic Broadcast)的一致性协议
ZooKeeper是一个典型的分布式数据一致性的解决方案,分布式应用程序可以基于它实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能
ZooKeeper致力于提供一个高性能、高可用,具有严格的顺序访问控制能力(主要是写操作的严格顺序性)的分布式协调服务
ZooKeeper会将全量数据保存在内存中,以此提高服务器吞吐、减少延迟
对于每个来自客户端的更新请求,ZooKeeper会分配一个全局唯一的递增编号来实现同步
集群角色
- Leader
- Follower
- Observer:不参与Leader选举,致力于提高读性能
ZooKeeper客户端通过TCP连接服务器
数据节点:数据模型中的数据单元,ZNode
ZNode分为持久节点和临时节点,临时节点生命周期和客户端会话绑定
Watcher
ZooKeeper允许用户在指定节点上注册一些Watcher,并且在一些特定事件触发的时候,ZooKeeper服务端会将事件通知到感兴趣的客户端上去
ZAB协议
ZAB协议并不像Paxos算法那样,一种通用的分布式一致性算法,而是一种特别为ZooKeeper设计的崩溃可恢复的原子消息广播算法
当Leader服务器不可用或者已经不存在过半服务器与该Leader服务器保持正常通信时,在重新开始新一轮的原子广播事务操作之前,ZAB会进入恢复模式选举新的Leader服务器,使集群彼此达到一个一致的状态,从消息广播模式进入到崩溃恢复模式。当集群过半机器都与新的Leader服务器完成了状态同步操作后ZAB协议会退出恢复模式
ZAB与Paxos联系与区别
Paxos算法中,一个新的选举产生的主进程会进行两个阶段的工作
1、读阶段,新的主进程会通过和所有其他进程进行通信的方式来搜集上一个主进程提出的提案,并将它们提交。
2、写阶段,当前主进程开始提出它自己的提案。
ZAB在Paxos基础上额外添加一个同步阶段。同步阶段之前,ZAB协议存在一个和Paxos读阶段类似的发现(Discovery)阶段
同步阶段中,新的Leader会确保存在过半的Follower已经提交了之前Leader周期中的所有事务Proposal
发现阶段的存在,确保所有进程都已经完成对之前所有事物Proposal的提交
ZAB协议主要用于构建一个高可用的分布式数据主备系统,例如ZooKeeper
Paxos算法则是用于构建一个分布式的一致性状态机系统