rocketmq由producer、consumer、broker、nameserver四个角色组成,对应到邮政系统中的四个角色就是发信者、收信者、负责暂存,传输、负责协调各地方邮局的管理机构。
启动RocketMQ 的顺序是先启动NameServer ,再启动Broker 。很多应用程序既要发送,又要接收,可以启动多个Producer 和Consumer 来发送多种消息,同时接收多种消息。
为了消除单点故障,增加可靠性或增大吞吐量,可以在多台机器上部署多个NameServer 和Broker ,为每个Broker 部署一个或多个Slave 。
1.NameServer
NameServer 是整个消息队列中的状态服务器,集群的各个组件通过它来了解全局的信息。同时各个角色的机器都要定期向NameServer 上报自己的状态,超时不上报的话, NameServer 会认为某个机器出故障不可用了,其他的组件会把这个机器从可用列表里移除。NamServer 可以部署多个,相互之间独立,其他角色同时向多个NameServer机器上报状态信息,从而达到热备份的目的。NameServer 本身是无状态的,也就是说NameServer 中的Broker 、Topic 等状态信息不会持久存储,都是由各个角色定时上报并存储到内存中的( NameServer 支持配置参数的持久化, 一般用不到) 。
相对来说,nameserver的稳定性非常高,原因如下:
nameserver互相独立,彼此没有通信关系,单台nameserver挂掉,不影响其他nameserver,即使全部挂掉,也不影响业务系统使用。
nameserver不会有频繁的读写,所以性能开销非常小,稳定性很高。
2.Broker
Broker 是RocketMQ 的核心,大部分‘重量级”工作都是由Broker 完成的,包括接收Producer 发过来的消息、处理Consumer 的消费消息请求、-消息的持久化存储、消息的HA机制以及服务端过滤功能等。
与nameserver关系
连接
单个broker和所有nameserver保持长连接
心跳
心跳间隔:每隔30秒(此时间无法更改)向所有nameserver发送心跳,心跳包含了自身的topic配置信息。
心跳超时:nameserver每隔10秒钟(此时间无法更改),扫描所有还存活的broker连接,若某个连接2分钟内(当前时间与最后更新时间差值超过2分钟,此时间无法更改)没有发送心跳数据,则断开连接。
断开
时机:broker挂掉;心跳超时导致nameserver主动关闭连接
动作:一旦连接断开,nameserver会立即感知,更新topc与队列的对应关系,但不会通知生产者和消费者
负载均衡
一个topic分布在多个broker上,一个broker可以配置多个topic,它们是多对多的关系。
如果某个topic消息量很大,应该给它多配置几个队列,并且尽量多分布在不同broker上,减轻某个broker的压力。
topic消息量都比较均匀的情况下,如果某个broker上的队列越多,则该broker压力越大。
可用性
由于消息分布在各个broker上,一旦某个broker宕机,则该broker上的消息读写都会受到影响。所以rocketmq提供了master/slave的结构,salve定时从master同步数据,如果master宕机,则slave提供消费服务,但是不能写入消息,此过程对应用透明,由rocketmq内部解决。
这里有两个关键点:
一旦某个broker master宕机,生产者和消费者多久才能发现?受限于rocketmq的网络连接机制,默认情况下,最多需要30秒,但这个时间可由应用设定参数来缩短时间。这个时间段内,发往该broker的消息都是失败的,而且该broker的消息无法消费,因为此时消费者不知道该broker已经挂掉。
消费者得到master宕机通知后,转向slave消费,但是slave不能保证master的消息100%都同步过来了,因此会有少量的消息丢失。但是消息最终不会丢的,一旦master恢复,未同步过去的消息会被消费掉。
可靠性
所有发往broker的消息,有同步刷盘和异步刷盘机制,总的来说,可靠性非常高
同步刷盘时,消息写入物理文件才会返回成功,因此非常可靠
异步刷盘时,只有机器宕机,才会产生消息丢失,broker挂掉可能会发生,但是机器宕机崩溃是很少发生的,除非突然断电
消息清理
扫描间隔
默认10秒,由broker配置参数cleanResourceInterval决定
空间阈值
物理文件不能无限制的一直存储在磁盘,当磁盘空间达到阈值时,不再接受消息,broker打印出日志,消息发送失败,阈值为固定值85%
清理时机
默认每天凌晨4点,由broker配置参数deleteWhen决定;或者磁盘空间达到阈值
文件保留时长
默认72小时,由broker配置参数fileReservedTime决定
读写性能
文件内存映射方式操作文件,避免read/write系统调用和实时文件读写,性能非常高
永远一个文件在写,其他文件在读
顺序写,随机读
利用linux的sendfile机制,将消息内容直接输出到sokect管道,避免系统调用
系统特性
大内存,内存越大性能越高,否则系统swap会成为性能瓶颈
IO密集
cpu load高,使用率低,因为cpu占用后,大部分时间在IO WAIT
磁盘可靠性要求高,为了兼顾安全和性能,采用RAID10阵列
磁盘读取速度要求快,要求高转速大容量磁盘
broker高可用性
消费端:
Master 角色的Broker 支持读和写, Slave 角色的Broker 仅支持读,也就是Producer 只能和Master 角色的Broker 连接写人消息; Consumer 可以连接Master 角色的Broker ,也可以连接Slave 角色的Broker 来读取消息。当Master繁忙或者不可用时,Consumer会被自动切换到Slave读。
发送端:
在创建Topic 的时候,把Topic 的多个Message Queue 创建在多个Broker 组上(相同Broker 名称,不同broker Id 的机器组成一个Broker 组),这样当一个Broker 组的Master 不可用后,其他组的Master 仍然可用, Producer 仍然可以发送消息。RocketMQ 目前还不支持把Slave 自动转成Master ,如果机器资源不足,需要把Slave 转成Master ,则要手动停止S lave 角色的Broker ,更改配置文件,用新的配置文件启动Broker
1)Topic与Message Queue
不同的topic名称用来区分不同类型的消息,所以对于发送和接受消息,得先创建topic
当topic要发送和接受的消息量特别大,需要能支持增加并行处理的机器来提高处理速度,这时候一个Topic 可以根据需求设置一个或多个Message Queue, Message Queue 类似分区或Partition
Topic 有了多个Message Queue 后,消息可以并行地向各个Message Queue 发送,消费者也可以并行地从多个Message Queue 读取消息并消费
2)订阅组
订阅组在提高系统的高可用性和吞吐量方面扮演着重要的角色,比如用Clustering 模式消费一个Topic 里的消息内容时,可以启动多个消费者并行消费,每个消费者只消费To pic 里消息的一部分,以此提高消费速度,这个时候就是通过订阅组来指明哪些消费者是同一组,同一组的消费者共同消费同一个Topic 里的内容。
3)Offset
Offset 是指某个Topic 下的一条消息在某个Message Queue 里的位置,通过Offset 的值可以定位到这条消息,或者指示Co nsumer 从这条消息开始向后继续处理。
3.生产者
与nameserver关系
连接
单个生产者者和一台nameserver保持长连接,定时查询topic配置信息,如果该nameserver挂掉,生产者会自动连接下一个nameserver,直到有可用连接为止,并能自动重连。
轮询时间
默认情况下,生产者每隔30秒从nameserver获取所有topic的最新队列情况,这意味着某个broker如果宕机,生产者最多要30秒才能感知,在此期间,发往该broker的消息发送失败。该时间由DefaultMQProducer的pollNameServerInteval参数决定,可手动配置。
心跳
与nameserver没有心跳
与broker关系
连接
单个生产者和该生产者关联的所有broker保持长连接。
心跳
默认情况下,生产者每隔30秒向所有broker发送心跳,该时间由DefaultMQProducer的heartbeatBrokerInterval参数决定,可手动配置。broker每隔10秒钟(此时间无法更改),扫描所有还存活的连接,若某个连接2分钟内(当前时间与最后更新时间差值超过2分钟,此时间无法更改)没有发送心跳数据,则关闭连接。
连接断开
移除broker上的生产者信息
负载均衡
生产者时间没有关系,每个生产者向队列轮流发送消息
4.消费者
与nameserver关系
连接
单个消费者和一台nameserver保持长连接,定时查询topic配置信息,如果该nameserver挂掉,消费者会自动连接下一个nameserver,直到有可用连接为止,并能自动重连。
心跳
与nameserver没有心跳
轮询时间
默认情况下,消费者每隔30秒从nameserver获取所有topic的最新队列情况,这意味着某个broker如果宕机,客户端最多要30秒才能感知。该时间由DefaultMQPushConsumer的pollNameServerInteval参数决定,可手动配置。
与broker关系
连接
单个消费者和该消费者关联的所有broker保持长连接。
心跳
默认情况下,消费者每隔30秒向所有broker发送心跳,该时间由DefaultMQPushConsumer的heartbeatBrokerInterval参数决定,可手动配置。broker每隔10秒钟(此时间无法更改),扫描所有还存活的连接,若某个连接2分钟内(当前时间与最后更新时间差值超过2分钟,此时间无法更改)没有发送心跳数据,则关闭连接,并向该消费者分组的所有消费者发出通知,分组内消费者重新分配队列继续消费
断开
时机:消费者挂掉;心跳超时导致broker主动关闭连接
动作:一旦连接断开,broker会立即感知到,并向该消费者分组的所有消费者发出通知,分组内消费者重新分配队列继续消费
负载均衡
集群消费模式下,一个消费者集群多台机器共同消费一个topic的多个队列,一个队列只会被一个消费者消费。如果某个消费者挂掉,分组内其它消费者会接替挂掉的消费者继续消费。
消费机制
本地队列
消费者不间断的从broker拉取消息,消息拉取到本地队列,然后本地消费线程消费本地消息队列,只是一个异步过程,拉取线程不会等待本地消费线程,这种模式实时性非常高。对消费者对本地队列有一个保护,因此本地消息队列不能无限大,否则可能会占用大量内存,本地队列大小由DefaultMQPushConsumer的pullThresholdForQueue属性控制,默认1000,可手动设置。
轮询间隔
消息拉取线程每隔多久拉取一次?间隔时间由DefaultMQPushConsumer的pullInterval属性控制,默认为0,可手动设置。
消息消费数量
监听器每次接受本地队列的消息是多少条?这个参数由DefaultMQPushConsumer的consumeMessageBatchMaxSize属性控制,默认为1,可手动设置。
消费进度存储
每隔一段时间将各个队列的消费进度存储到对应的broker上,该时间由DefaultMQPushConsumer的persistConsumerOffsetInterval属性控制,默认为5秒,可手动设置。
zookeeper为什么不用?
ZooKeeper 是Apache 的一个开源软件,为分布式应用程序提供协调服务。那为什么RocketMQ 要自己造*,开发集群的管理程序呢?答案是
ZooKeeper 的功能很强大,包括自动Master 选举等, RocketMQ 的架构设计决定了它不需要进行Master 选举,用不到这些复杂的功能,只需要一个轻量级的元数据服务器就足够了。中间件对稳定性要求很高, RocketMQ 的NameServer 只有很少的代码,容易维护,所以不需要再依赖另一个中间件,从而减少整体维护成本。