Kafka高可用——replica分配方式

Kafka的Replica

概念

kafka的replica指的是消息的备份,为了保证kafka的高可用(当leader节点挂了之后,kafka依然能提供服务)kafka提供了备份的功能。这个备份是针对partition的。

可以通过 default.replication.factor 对replica的数目进行配置,默认值为1,表示不对topic进行备份。如果配置为2,表示除了leader节点,对于topic里的每一个partition,都会有一个额外的备份。

replica分配

为了起到备份的效果,简单设想下,如果让我们来分配replica,我们会怎么分配?
1)replica与所备份的节点不能再一台机器上,否则就起不到备份的效果
2)replica尽量均匀的分布在集群机器上,如果replica全部都在某几台机器上,那么一旦这台机器挂了,会丢失多个partition的备份

假设有3个broker、一个topic1、topic1有3个partition,default.replication.factor被设置为2,可能会这样分配


Kafka高可用——replica分配方式
简单的replica分配示意图(圆角矩形代表replica)

这种分配保证了,任何一台机器挂掉,kafka集群依然有备份可用。

replica分配算法

假设有5个broker,10个partitions,备份数设置为3

1、从一个集群的随机节点开始,轮询放置第一个replica

broker-0 broker-1 broker-2 broker-3 broker-4 replica
p0 p1 p2 p3 p4 1st replica
p5 p6 p7 p8 p9 1st replica

2、后面的replica增加一个偏移量,继续放置,比如这里的p0,从broker-0开始,下一个replica就从broker-1开始

broker-0 broker-1 broker-2 broker-3 broker-4 replica
p0(start) p1 p2 p3 p4 1st replica
p5(start) p6 p7 p8 p9 1st replica
p4 p0 (start) p1 p2 p3 2nd replica
p8 p9 p5(start) p6 p7 2nd replica
p3 p4 p0(start) p1 p2 3rd replica
p7 p8 p9 p5(start) p6 3rd replica

通过这种方式,replica尽可能的被均匀分配在多个broker上

多机房

上述方法,可以保证多个broker存在时,哪怕其中一个broker挂了,kafka依旧能提供服务。但是,当有多个机房时候,这种分配方式,不能保证,跨机房的高可用。

示例:4个broker,4个partition,每个partition有1个备份

Kafka高可用——replica分配方式
备份(不考虑机房)

按照之前的算法,replica会按照上图所示设置备份。这样假设机房1因为某个原因挂掉了,partition0的数据就会丢失掉。同理,机房2挂了,partition2也会丢失掉。

replica分配算法考虑机房

kafka可以配置一个参数broker.rack说明当前broker在哪个机房。

如上图,配置
broker0 -> rack1
broker1 -> rack1
broker2 -> rack2
broker3 -> rack2

当进行replica排序时候,不会仅仅按照broker顺序进行排序,而是会保证机房错开。比如这种情况的排序可能是
broker0,broker2,broker1,broker3

这样子排序之后,再次按照上述replica分配算法分配。


Kafka高可用——replica分配方式
replica分配(考虑不同机房)

这种分配方式,保证了不同机房之间拥有全部的topic,一个机房的数据挂掉,仍然有另一个机房的数据可以使用。(前提条件,replica数目大于或等于机房的数目)

总结

kafka通过replica分配的算法保证了当某台机器挂掉,甚至某个机房挂掉,依然有备份可用。这种分配备份的算法,可以套用在需要有备份的场景,比如hdfs(没研究过,不知道是不是一样的)。

参考资料

https://community.hortonworks.com/questions/71458/can-anyone-explain-kafka-rack-awareness-feature.html
kafka源码 kafka.admin.AdminUtils#assignReplicasToBrokers

上一篇:JDBC连接MySQL操作事务


下一篇:使用Zookeeper实现选举