1、Redis的使用规范
1.1、 key的规范要点
我们设计Redis的key的时候,要注意以下这几个点:
- 以业务名为key前缀,用冒号隔开,以防止key冲突覆盖。如,live:rank:1
- 确保key的语义清晰的情况下,key的长度尽量小于30个字符。
- key禁止包含特殊字符,如空格、换行、单双引号以及其他转义字符。
- Redis的key尽量设置ttl,以保证不使用的Key能被及时清理或淘汰。
1.2、value的规范要点
Redis的value值不可以随意设置的哦。
第一点,如果大量存储bigKey是会有问题的,会导致慢查询,内存增长过快等等。
- 如果是String类型,单个value大小控制10k以内。
- 如果是hash、list、set、zset类型,元素个数一般不超过5000。
第二点,要选择适合的数据类型。不少小伙伴只用Redis的String类型,上来就是set和get。实际上,Redis 提供了丰富的数据结构类型,有些业务场景,更适合hash、zset
等其他数据结果。
反例:
set user:666:name jay
set user:666:age 18
复制代码
正例
hmset user:666 name jay age 18
复制代码
1.3. 给Key设置过期时间,同时注意不同业务的key,尽量过期时间分散一点
- 因为Redis的数据是存在内存中的,而内存资源是很宝贵的。
- 我们一般是把Redis当做缓存来用,而不是数据库,所以key的生命周期就不宜太长久啦。
- 因此,你的key,一般建议用expire设置过期时间。
如果大量的key在某个时间点集中过期,到过期的那个时间点,Redis可能会存在卡顿,甚至出现缓存雪崩现象,因此一般不同业务的key,过期时间应该分散一些。有时候,同业务的,也可以在时间上加一个随机值,让过期时间分散一些。
1.4.建议使用批量操作提高效率
我们日常写SQL的时候,都知道,批量操作效率会更高,一次更新50条,比循环50次,每次更新一条效率更高。其实Redis操作命令也是这个道理。
Redis客户端执行一次命令可分为4个过程:1.发送命令-> 2.命令排队-> 3.命令执行-> 4. 返回结果。1和4 称为RRT(命令执行往返时间)。 Redis提供了批量操作命令,如mget、mset等,可有效节约RRT。但是呢,大部分的命令,是不支持批量操作的,比如hgetall,并没有mhgetall存在。Pipeline 则可以解决这个问题。
Pipeline是什么呢?它能将一组Redis命令进行组装,通过一次RTT传输给Redis,再将这组Redis命令的执行结果按顺序返回给客户端.
我们先来看下没有使用Pipeline执行了n条命令的模型:
使用Pipeline执行了n次命令,整个过程需要1次RTT,模型如下:
2、Redis 有坑的那些命令
2.1. 慎用O(n)
复杂度命令,如hgetall
、smember
,lrange
等
因为Redis是单线程执行命令的。hgetall、smember等命令时间复杂度为O(n),当n持续增加时,会导致 Redis CPU 持续飙高,阻塞其他命令的执行。
hgetall、smember,lrange等这些命令不是一定不能使用,需要综合评估数据量,明确n的值,再去决定。 比如hgetall,如果哈希元素n比较多的话,可以优先考虑使用hscan。
2.2 慎用Redis的monitor命令
Redis Monitor 命令用于实时打印出Redis服务器接收到的命令,如果我们想知道客户端对redis服务端做了哪些命令操作,就可以用Monitor 命令查看,但是它一般调试用而已,尽量不要在生产上用!因为monitor命令可能导致redis的内存持续飙升。
monitor的模型是酱紫的,它会将所有在Redis服务器执行的命令进行输出,一般来讲Redis服务器的QPS是很高的,也就是如果执行了monitor命令,Redis服务器在Monitor这个客户端的输出缓冲区又会有大量“存货”,也就占用了大量Redis内存。
2.3、生产环境不能使用 keys指令
Redis Keys 命令用于查找所有符合给定模式pattern的key。如果想查看Redis 某类型的key有多少个,不少小伙伴想到用keys命令,如下:
keys key前缀*
复制代码
但是,redis的keys
是遍历匹配的,复杂度是O(n)
,数据库数据越多就越慢。我们知道,redis是单线程的,如果数据比较多的话,keys指令就会导致redis线程阻塞,线上服务也会停顿了,直到指令执行完,服务才会恢复。因此,一般在生产环境,不要使用keys指令。官方文档也有声明:
Warning: consider KEYS as a command that should only be used in production environments with extreme care. It may ruin performance when it is executed against large databases. This command is intended for debugging and special operations, such as changing your keyspace layout. Don't use KEYS in your regular application code. If you're looking for a way to find keys in a subset of your keyspace, consider using sets.
其实,可以使用scan指令,它同keys命令一样提供模式匹配功能。它的复杂度也是 O(n),但是它通过游标分步进行,不会阻塞redis线程;但是会有一定的重复概率,需要在客户端做一次去重。
scan支持增量式迭代命令,增量式迭代命令也是有缺点的:举个例子, 使用 SMEMBERS 命令可以返回集合键当前包含的所有元素, 但是对于 SCAN 这类增量式迭代命令来说, 因为在对键进行增量式迭代的过程中, 键可能会被修改, 所以增量式迭代命令只能对被返回的元素提供有限的保证 。
2.4 禁止使用flushall、flushdb
- Flushall 命令用于清空整个 Redis 服务器的数据(删除所有数据库的所有 key )。
- Flushdb 命令用于清空当前数据库中的所有 key。
这两命令是原子性的,不会终止执行。一旦开始执行,不会执行失败的。
2.5 注意使用del命令
删除key你一般使用什么命令?是直接del?如果删除一个key,直接使用del命令当然没问题。但是,你想过del的时间复杂度是多少嘛?我们分情况探讨一下:
- 如果删除一个String类型的key,时间复杂度就是
O(1)
,可以直接del。 - 如果删除一个List/Hash/Set/ZSet类型时,它的复杂度是
O(n)
, n表示元素个数。
因此,如果你删除一个List/Hash/Set/ZSet类型的key时,元素越多,就越慢。当n很大时,要尤其注意,会阻塞主线程的。那么,如果不用del,我们应该怎么删除呢?
- 如果是List类型,你可以执行
lpop或者rpop
,直到所有元素删除完成。- 如果是Hash/Set/ZSet类型,你可以先执行
hscan/sscan/scan
查询,再执行hdel/srem/zrem
依次删除每个元素。
2.6 避免使用SORT、SINTER等复杂度过高的命令。
执行复杂度较高的命令,会消耗更多的 CPU 资源,会阻塞主线程。所以你要避免执行如SORT、SINTER、SINTERSTORE、ZUNIONSTORE、ZINTERSTORE
等聚合命令,一般建议把它放到客户端来执行。