另一种观点认为,缓存服务不是数据存储服务,缓存服务器宕机引起缓存数据丢失
导致服务器负载压力过高应该通过其他手段解决,而不是提高缓存服务本身的高可用。
笔者持后一种观点,对于缓存服务器集群中的单机宕机,如果缓存服务器集群规模 较大,那么单机宕机引起的缓存数据丢失比例和数据库负载压力变化都较小,对整个系 统影响也较小。扩大缓存服务器集群规模的一个简单手段就是整个网站共享同一个分布 式缓存集群,单独的应用和产品不需要部署自己的缓存服务器,只需要向共享缓存集群 申请缓存资源即可。并且通过逻辑或物理分区的方式将每个应用的缓存部署在多台服务 器上,任何一台服务器宕机引起的缓存失效都只影响应用缓存数据的一小部分,不会对 应用性能和数据库负载造成太大影响。
1 CAP 原理
在讨论高可用数据服务架构之前,必须先讨论的一个话题是,为了保证数据的高可 用,网站通常会牺牲另一个也很重要的指标:数据一致性。
高可用的数据有如下几个层面的含义。
数据持久性
保证数据可持久存储,在各种情况下都不会岀现数据丢失的问题。为了实现数据的 持久性,不但在写入数据时需要写入持久性存储,还需要将数据备份一个或多个副本, 存放在不同的物理存储设备上,在某个存储故障或灾害发生时,数据不会丢失。
数据可访问性
在多份数据副本分别存放在不同存储设备的情况下,如果一个数据存储设备损坏, 就需要将数据访问切换到另一个数据存储设备上,如果这个过程不能很快完成(终端用 户几乎没有感知),或者在完成过程中需要停止终端用户访问数据,那么这段时间数据是 不可访问
《一线大厂Java面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》
【docs.qq.com/doc/DSmxTbFJ1cmN1R2dB】 完整内容开源分享
的。
数据一致性
在数据有多份副本的情况下,如果网络、服务器或者软件出现故障,会导致部分副 本写入成功,部分副本写入失败。这就会造成各个副本之间的数据不一致,数据内容冲 突。实践中,导致数据不一致的情形有很多种,表现形式也多种多样,比如数据更新返 回操作失败,事实上数据在存储服务器已经更新成功。
CAP原理认为,一个提供数据服务的存储系统无法同时满足数据一致性(Consistency )、数据可用性(Availibility )、分区耐受性(Patition Tolerance,系统具有跨网络分区的伸缩性)这三个条件,如图5.10所示。
在大型网站应用中,数据规模总是快速扩张的,因此可伸缩性即分区耐受性必不可少,规模变大以后,机器数量也会变得庞大,这时网络和服务器故障会频繁岀现,要想 保证应用可用,就必须保证分布式处理系统的高可用性。所以在大型网站中,通常会选 择强化分布式存储系统的可用性(A )和伸缩性(P ),而在某种程度上放弃一致性(C )o 一般说来,数据不一致通常出现在系统高并发写操作或者集群状态不稳(故障恢复、集 群扩容……)的情况下,应用系统需要对分布式数据处理系统的数据不一致性有所了解 并进行某种意义上的补偿和纠错,以避免出现应用系统数据不正确。
2012年淘宝“双十一”活动期间,在活动第一分钟就涌入了 1000万独立用户访问, 这种极端的高并发场景对数据处理系统造成了巨大压力,存储系统较弱的数据一致性导 致岀现部分商品超卖现象(交易成功的商品数超过了商品库存数)o
CAP原理对于可伸缩的分布式系统设计具有重要意义,在系统设计开发过程中,不恰 当地迎合各种需求,企图打造一个完美的产品,可能会使设计进入两难境地,难以为继。
具体说来,数据一致性又可分为如下几点。
数据强一致
各个副本的数据在物理存储中总是一致的;数据更新操作结果和操作响应总是一致 的,即操作响应通知更新失败,那么数据一定没有被更新,而不是处于不确定状态。
数据用户一致
即数据在物理存储中的各个副本的数据可能是不一致的,但是终端用户访问时,通
过纠错和校验机制,可以确定一个一致的且正确的数据返回给用户。
数据最终一致
这是数据一致性中较弱的一种,即物理存储的数据可能是不一致的,终端用户访问到的数据可能也是不一致的(同一用户连续访问,结果不同;或者不同用户同时访问, 结果不同),但系统经过一段时间(通常是一个比较短的时间段)的自我恢复和修正,数 据最终会达到一致。
因为难以满足数据强一致性,网站通常会综合成本、技术、业务场景等条件,结合 应用服务和其他的数据监控与纠错功能,使存储系统达到用户一致,保证最终用户访问 数据的正确性。
2 数据备份
数据备份是一种古老而有效的数据保护手段,早期的数据备份手段主要是数据冷备, 即定期将数据复制到某种存储介质(磁带,光盘……)上并物理存档保管,如果系统存 储损坏,那么就从冷备的存储设备中恢复数据。
冷备的优点是简单和廉价,成本和技术难度都较低。缺点是不能保证数据最终一致,由于数据是定期复制,因此备份设备中的数据比系统中的数据陈旧,如果系统数据丢失, 那么从上个备份点开始后更新的数据就会永久丢失,不能从备份中恢复。同时也不能保 证数据可用性,从冷备存储中恢复数据需要较长的时间,而这段时间无法访问数据,系 统也不可用。
因此,数据冷备作为一种传统的数据保护手段,依然在网站日常运维中使用,同时 在网站实时在线业务中,还需要进行数据热备,以提供更好的数据可用性。
数据热备可分为两种:异步热备方式和同步热备方式。
异步方式是指多份数据副本的写入操作异步完成,应用程序收到数据服务系统的写 操作成功响应时,只写成功了一份,存储系统将会异步地写其他副本(这个过程有可能 会失败)。如图5.11所示。
在异步写入方式下,存储服务器分为主存储服务器(Master )和从存储服务器(Slave ), 应用程序正常情况下只连接主存储服务器,数据写入时,由主存储服务器的写操作代理 模块将数据写入本机存储系统后立即返回写操作成功响应,然后通过异步线程将写操作 数据同步到从存储服务器。