开源键值对存储数据库Redis在4月1日发布了3.0.0版。主要新特性包括:Redis Cluster,Redis子集的分布式实现;新的“嵌套字符串”对象编码减少缓存遗漏,大幅提高某些工作负荷的速度;等等。开发者Salvatore Sanfilippo表示,Redis 3.0.0是第一个原生支持集群的稳定版本,可能需要1到2年才能成熟,它对Redis生态系统具有重要意义,Redis Cluster将向用户提供某种程度的自动伸缩和容错能力,将改变用户看待Redis的方式。
集群简介
Redis 集群是一个可以在多个 Redis 节点之间进行数据共享的设施(installation)。
Redis 集群不支持那些需要同时处理多个键的 Redis 命令, 因为执行这些命令需要在多个 Redis 节点之间移动数据, 并且在高负载的情况下, 这些命令将降低 Redis 集群的性能, 并导致不可预测的行为。
Redis 集群通过分区(partition)来提供一定程度的可用性(availability): 即使集群中有一部分节点失效或者无法进行通讯, 集群也可以继续处理命令请求。
Redis 集群提供了以下两个好处:
-
将数据自动切分(split)到多个节点的能力。
-
当集群中的一部分节点失效或者无法进行通讯时, 仍然可以继续处理命令请求的能力。
Redis 集群的现状
目前redis支持的cluster特性:
1) 节点自动发现
2) slave->master 选举,集群容错
3) Hot resharding:在线分片
4) 集群管理:cluster xxx
5) 基于配置(nodes-port.conf)的集群管理
6) ASK 转向/MOVED 转向机制
Redis 集群的架构
redis-cluster架构图
架构细节:
1) 所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽。
2) 节点的fail是通过集群中超过半数的节点检测失效时才生效。
3) 客户端与redis节点直连,不需要中间proxy层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可。
4) redis-cluster把所有的物理节点映射到[0-16383]slot上,cluster 负责维护node<->slot<->value。
redis-cluster选举:容错
1) 领着选举过程是集群中所有master参与,如果半数以上master节点与master节点通信超过(cluster-node-timeout),认为当前master节点挂掉。
2) 什么时候整个集群不可用(cluster_state:fail)?
A: 如果集群任意master挂掉,且当前master没有slave.集群进入fail状态,也可以理解成集群的slot映射[0-16383]不完成时进入fail状态。
ps : redis-3.0.0.rc1加入cluster-require-full-coverage参数,默认关闭,打开集群兼容部分失败。
B: 如果集群超过半数以上master挂掉,无论是否有slave集群进入fail状态。
ps:当集群不可用时,所有对集群的操作做都不可用,收到((error) CLUSTERDOWN The cluster is down)错误。
参考:
http://redisdoc.com/topic/cluster-tutorial.html