阿里面试Redis常考问题

2022-05-25 00:28:15

一提到Redis缓存，我们不得不了解的三个问题就是：缓存雪崩、缓存击穿和缓存穿透。这三个问题一旦发生，会导致大量的请求直接请求到数据库层。如果并发压力大，就会导致数据库崩溃。那p0级的故障是没跑了。

今天我们就来详细的了解这个三个问题诱因以及如何解决。

废话不多说，我们直接开搞！！！

一、缓存雪崩

什么是缓存雪崩？缓存雪崩就是大量请求无法在redis缓存中进行处理，而是直接发送到了数据库层，使得数据库压力陡增。就好像redis一下子突然失效了一样。一般造成缓存雪崩主要有两个原因，我们来一一分析一下。

1.缓存中大量数据同时过期

缓存中大量数据同时过期，就会导致大量请求无法在redis缓存层面进行处理。具体来说，就是给redis中大量数据设置了相同的过期时间，一旦它们同时失效，应用就会把请求直接发送给数据库，直接从数据库中读取数据。如果应用的并发量很大，那数据库的压力就会很大。如下图所示:

针对大量数据同时失效带来的缓存雪崩问题，我们一般采取以下两种解决方案。（1）我们在开发过程中要避免给大量数据设置相同的过期时间。我们可以在给数据设置过期时间时给时间加一个很小的随机数，这样不同数据的过期时间就会有所差别，但差别也不会太大，保证数据在一定范围内过期，从而满足业务层要求同时过期的需要。（2）服务降级。所谓的服务降级，是指发生缓存雪崩后，针对不同的数据采取不同的策略。

当业务访问非核心数据时（例如商品属性信息），我们直接返回预定义的信息。
当业务访问的是如库存数据等核心数据时，仍然允许查询缓存，如果缓存缺失，也可以从数据库中继续读取。

这样一来，只有部分过期的数据会访问数据库，所以数据库压力就没那么大。

2.Redis实例发生故障

当Redis实例发生故障，那就相当于缓存已经废掉了，所以大量请求会直接请求数据库，造成数据库压力变大，甚至宕机。针对这种情况发生的缓存雪崩，我们有以下两种处理方式。 （1）在业务系统侧实现服务熔断或请求限流机制 所谓的服务熔断，就是指在发生缓存雪崩时，为了防止大流量直接打到数据库，我们会暂停对缓存系统的访问。当上层应用访问缓存时，缓存接口不会去访问Redis实例，而是直接返回。等redis恢复后，再允许应用程序请求缓存系统。这样就会避免因为redis缓存宕机，导致数据库压力陡增的情况。
服务熔断虽然可以保证数据库不被崩溃，但是暂停了整个服务的访问，对业务的影响范围大，为了减小对上层服务的影响，我们一般采用请求限流。请求限流是指业务系统去控制每秒进入系统的请求数，避免过多的请求被发送到数据库。比如正常运行时，业务系统每秒进入的请求是1万个，其中有80%在缓存中就可以处理了，有20%会去数据库中处理。一旦发生缓存雪崩，100%的流量就会请求数据库，为了不造成数据库崩溃，我们就可以启动请求限流机制。业务系统只允许30%的流量进入，而70%的流量被拒绝服务。这也是目前主流大厂常用的方法，比如在某个明星爆出大瓜后，我们刷微博经常刷不出来，多刷几次就能进入，那就是因为做了服务降级。只允许一部分流量进入。

（2）使用高可靠集群

我们可以通过主从节点来部署高可靠的Redis集群。当主节点挂掉后，从节点还可以切换成主节点。

二、缓存击穿

缓存击穿是指针对某个热点数据，无法在缓存中进行处理，然后访问该数据的大量请求，一下子都发到后端数据库中，导致数据库压力激增。对于缓存击穿的情况，经常发生在热点数据过期失效时。
为了避免这种情况发生，最常采取的措施就是对于访问特别频繁的热点数据，我们就不设置过期时间了。这样一来，对热点数据的访问，都可以在缓存中进行。

三、缓存穿透

缓存穿透是指要访问的数据既不在缓存中，也不在数据库中，会导致请求缓存时，发生缓存缺失，然后请求数据库，发现数据库中也没有需要的数据。这样一来，缓存就成了“摆设”，如果有大量的这种请求，就会给数据库带来很大的压力。
这个问题一般都是黑客进行恶意攻击造成的。为了避免这种问题发生，我们有三种解决方式。

1、缓存空值或者缺省值

一旦发生缓存穿透，我们就可以在redis中设置一个空值或者给定的某个缺省值。这样，业务应用的后续这种请求，都可以命中缓存。这样就避免了把大量请求发送给数据库了。

2、使用布隆过滤器来快速判断数据是否存在

这里我们先来解释一下什么是布隆过滤器。
布隆过滤器由一个初值都为0的bit数组和N个哈希函数组成，可以用来快速判断某个数据是否存在。当我们想标记某个数据存在时，布隆过滤器会通过三个操作来完成标记：

首先，使用N个哈希函数，分别计算数据的哈希值，得到N个哈希值。
然后把这N个哈希值对bit数组的长度取模，得到每个哈希值在数组中的位置。
最后，我们把对应位置的bit位设置为1，这样就完成了布隆过滤器中标记数据的操作。

如果数据不存在，也就是我们没有用布隆过滤器标记过，bit数组对应的bit位为0。当我们需要判断某个数据是否存在时，我们就执行上面的计算过程，我们先求出这个数据对应的hash值，然后取模，然后去bit数组查这N个位置上的bit值。只要这N个bit值有一个不为1，就表明这个数据没有被标记过。基于布隆过滤器的快速检测特性，我们可以把数据写入数据库时，使用布隆过滤器做个标记，当缓存失效后，上层应用查询数据库时，可以通过查询布隆过滤器快速判断数据是否存在。如果不存在，就不用在去数据库中去查了。这样一来，即使发生缓存穿透，也不会对数据库造成压力。

3、业务层对请求进行检测

缓存穿透发生的原因主要就是恶意请求访问不存在的数据，所以业务层接受到请求后，一定要进行合法性检测，把恶意请求给过滤掉，这样就可以避免缓存穿透的问题了。

今天我们就聊到这里，如果感兴趣，记得关注一波公众号【程序员学长】，有你意想不到的收获哦。

码农公寓