Redis的学习笔记 day02_基本数据类型

2022-10-15 13:50:05

Redis作为内存中的数据结构存储系统，它可以用作数据库、缓存和消息中间件。它的value支持多种类型的数据结构，基本数据结构包含：字符串（strings）、 散列（hashes）、 列表（lists）、集合（sets）、 有序集合（sorted sets）五种。这五种数据结构在我们工作中经常使用到，面试过程中经常被问到，因此熟练掌握这5种基本数据结构的使用和应用场景是Redis知识最基础也是最重要的部分。

1. 字符串（strings）

1.1 类型介绍

字符串是Redis最简单的储存类型，它存储的值可以是字符串、整数或者浮点数，对整个字符串或者字符串的其中一部分执行操作；对整数或者浮点数执行自增（increment）或者自减（decrement）操作。

Redis的字符串是一个由字节组成的序列，跟java里面的ArrayList有点类似，采用预分配冗余空间的方式来减少内存的频繁分配，如图中所示，内部为当前字符串实际分配的空间 capacity 一般要高于实际字符串长度 len。当字符串长度小于 1M 时，扩容都是加倍现有的空间，如果超过 1M，扩容时一次只会多扩 1M 的空间。需要注意的是字符串最大长度为 512M。

1.2 应用场景

字符串类型在工作中使用广泛，主要用于缓存数据，提高查询性能。比如存储登录用户信息、电商中存储商品信息、可以做计数器（想知道什么时候*一个IP地址(访问超过几次)）等等。

操作指令

set key value: 添加一条String类型数据
get key: 获取一条String类型数据
mset key1 value1 key2 value2: 添加多条String类型数据
mget key1 key2: 获取多条String类型数据
incr key: 自增（+1）
incrby key step: 按照步长（step）自增
decr key: 自减（-1）
decrby key step: 按照步长（step）递减

实操

# 插入字符串
>set username zhangsan
"OK"

# 获取字符串
>get username
"zhangsan"

# 插入多个字符串
>mset age 18 address bj
"OK"

# 获取多个字符串
>mget username age
 1)  "zhangsan"
 2)  "18"

# 自增
>incr num
"1"
>incr num
"2"

# 自减
>decr num
"1"

# 指定步长自增
>incrby num 2
"3"
>incrby num 2
"5"

# 指定步长自减
>decrby num 3
"2"

# 删除
>del num
"1"

2. 散列（hashes）

2.1 类型介绍

散列相当于Java中的HashMap，内部是无序字典。实现原理跟HashMap一致。一个哈希表有多个节点，每个节点保存一个键值对。

与Java中的HashMap不同的是，rehash 的方式不一样，因为 Java 的 HashMap 在字典很大时，rehash 是个耗时的操作，需要一次性全部 rehash。Redis 为了高性能，不能堵塞服务，所以采用了渐进式 rehash 策略。

渐进式 rehash 会在 rehash 的同时，保留新旧两个 hash 结构，查询时会同时查询两个 hash 结构，然后在后续的定时任务中以及 hash 操作指令中，循序渐进地将旧 hash 的内容一点点迁移到新的 hash 结构中。当搬迁完成了，就会使用新的hash结构取而代之。

当 hash 移除了最后一个元素之后，该数据结构自动被删除，内存被回收。

2.2 应用场景

Hash也可以同于对象存储，比如存储用户信息，与字符串不一样的是，字符串是需要将对象进行序列化（比如json序列化）之后才能保存，而Hash则可以讲用户对象的每个字段单独存储，这样就能节省序列化和反序列的时间。如下：

此外还可以保存用户的购买记录，比如key为用户id，field为商品id，value为商品数量。同样还可以用于购物车数据的存储，比如key为用户id，field为商品id，value为购买数量等等。

操作指令

# 设置属性
hset keyname field1 value1 field2 value2
# 获取某个属性值
hget keyname field
# 获取所有属性值
hgetall keyname
# 删除某个属性
hdel keyname field
# 获取属性个数
hlen keyname
# 按照步长自增某个属性（该属性必须是数字）
hincrby keyname field step

实操

# 插入 hash 数据
>hset userInfo username zhangsan age 18 address bj
"3"

# 获取 hash 单条 field 数据
>hget userInfo username
"zhangsan"
>hget userInfo age
"18"

# 获取 hash 多个 field 数据
>hmget userInfo username age
1) "zhangsan"
2) "18"

# 获取 hash 所有 field 数据
>hgetall userInfo
1) "username"
2) "zhangsan"
3) "age"
4) "18"
5) "address"
6) "bj"

# 获取 hash 的 field 个数
>hlen userInfo
"3"

# 自增 hash 的某个 field
>hincrby userInfo age 2
"20"
>hincrby userInfo age 2
"22"

# 删除 hash 的某个 field
>hdel userInfo age
"1"

# 删除 hash 所有数据
>del userInfo
"1"

3. 列表（lists）

3.1 类型介绍

Redis中的lists相当于Java中的LinkedList，实现原理是一个双向链表（其底层是一个快速列表），即可以支持反向查找和遍历，更方便操作。插入和删除操作非常快，时间复杂度为 O(1)，但是索引定位很慢，时间复杂度为 O(n)。

删除

3.2 应用场景

lists的应用场景非常多，可以利用它轻松实现热销榜；可以实现工作队列（利用lists的push操作，将任务存在lists中，然后工作线程再用pop操作将任务取出进行执行）;可以实现最新列表，比如最新评论等。

操作指令

# 左进
lpush key value1 value2 value3...

# 左出
lpop key

# 右进
rpush key value1 value2 value3...

# 右出
rpop key

# 从左往右读取 start和end是下标
lrange key start end

实操

# 从 list 左边依次插入
>lpush student zhangsan lisi wangwu
"3"

# 从 list 右边插入
>rpush student tianqi
"4"

# 从 list 左边弹出一个
>lpop liangshan
"wangwu"

# 从 list 右边弹出一个
>rpop liangshan
"tianqi"

# 获取 list 下标 0 ~ 1 的数据(左闭右闭)
>lrange liangshan 0 1
 1) "lisi"
 2) "zhangsan"

注意：blpop 阻塞版获取

为什么要阻塞版本的pop呢，主要是为了避免轮询。举个简单的例子如果我们用list来实现一个工作队列。执行任务的thread可以调用阻塞版本的pop去获取任务这样就可以避免轮询去检查是否有任务存在。当任务来时候工作线程可以立即返回，也可以避免轮询带来的延迟。

4. 集合（sets）

4.1 类型介绍

集合类似Java中的HashSet，内部实现是一个 value永远为null的HashMap，实际就是通过计算hash的方式来快速排重的，这也是set能提供判断一个成员是否在集合内的原因。

4.2 应用场景

redis的sets类型是使用哈希表构造的，因此复杂度是O(1)，它支持集合内的增删改查，并且支持多个集
合间的交集、并集、差集操作。可以利用这些集合操作，解决程序开发过程当中很多数据集合间的问题。比如计算网站独立ip，用户画像中的用户标签，共同好友等功能

操作指令

# 添加内容
sadd key value1 value2 

# 查询key里所有的值
smembers key 

# 移除key里面的某个value
srem key value 

# 随机移除某个value
spop key 

# 返回两个set的并集
 sunion key1 key2 

# 返回key1踢出交集的那部分(差集)
sdiff key1 key2 

# 跟siffer相反，返回交集
sinter key1 key2

实操

# 插入多条数据并去重
>sadd nums 1 2 3
"3"

# 插入多条数据并去重
>sadd nums 1 2 3
"0"

# 获取所有数据
>smembers nums
1) "1"
2) "2"
3) "3"

# 删除一条数据，返回的 1 表示删除了一条
>srem nums 2
"1"

# 弹出一条数据，返回的 1 表示弹出的数据值为 1
>spop nums
"1"

# 插入多条数据并去重
>sadd nums1 1 2 3
"3"
>sadd nums2 2 3 4
"3"

# 交集
>sinter nums1 nums2
1) "2"
2) "3"

# 差集
>sdiff nums1 nums2
1) "1"

# 并集
>sunion nums1 nums2
1) "1"
2) "2"
3) "3"
4) "4"

5. 有序集合（sorted sets）

5.1 类型介绍

sorted sets是Redis类似于 SortedSet 和 HashMap 的结合体，一方面它是一个 set，保证了内部 value 的唯一性，另一方面它可以给每个 value 赋予一个 score，代表这个 value 的排序权重。内部使用HashMap和跳跃表(SkipList)来保证数据的存储和有序，HashMap里放的是成员到score的映射，而跳跃表里存放的是所有的成员，排序依据是HashMap里存的score,使用跳跃表的结构可以获得比较高的查找效率，并且在实现上比较简单。sorted sets中最后一个 value 被移除后，数据结构自动删除，内存被回收。

5.1.1 跳跃列表

sorted sets内部的排序功能是通过「跳跃列表」数据结构来实现的，它的结构非常特殊，也比较复杂。因为 zset 要支持随机的插入和删除，所以它不好使用数组来表示。我们先看一个普通的链表结构。
我们需要这个链表按照 score 值进行排序。这意味着当有新元素需要插入时，要定位到特定位置的插入点，这样才可以继续保证链表是有序的。通常我们会通过二分查找来找到插入点，但是二分查找的对象必须是数组，只有数组才可以支持快速位置定位，链表做不到，那该怎么办？

想想一个创业公司，刚开始只有几个人，团队成员之间人人平等，都是联合创始人。随着公司的成长，人数渐渐变多，团队沟通成本随之增加。这时候就会引入组长制，对团队进行划分。每个团队会有一个组长。开会的时候分团队进行，多个组长之间还会有自己的会议安排。公司规模进一步扩展，需要再增加一个层级 —— 部门，每个部门会从组长列表中推选出一个代表来作为部长。部长们之间还会有自己的高层会议安排。

跳跃列表就是类似于这种层级制，最下面一层所有的元素都会串起来。然后每隔几个元素挑选出一个代表来，再将这几个代表使用另外一级指针串起来。然后在这些代表里再挑出二级代表，再串起来。最终就形成了金字塔结构。

想想你老家在世界地图中的位置：亚洲–>中国->安徽省->蚌埠市->固镇县->刘集镇->xxx村->xxxx号，也是这样一个类似的结构。

「跳跃列表」之所以「跳跃」，是因为内部的元素可能「身兼数职」，比如上图中间的这个元素，同时处于 L0、L1 和 L2 层，可以快速在不同层次之间进行「跳跃」。

定位插入点时，先在顶层进行定位，然后下潜到下一级定位，一直下潜到最底层找到合适的位置，将新元素插进去。你也许会问，那新插入的元素如何才有机会「身兼数职」呢？

跳跃列表采取一个随机策略来决定新元素可以兼职到第几层。

首先 L0 层肯定是 100% 了，L1 层只有 50% 的概率，L2 层只有 25% 的概率，L3 层只有 12.5% 的概率，一直随机到最顶层 L31 层。绝大多数元素都过不了几层，只有极少数元素可以深入到顶层。列表中的元素越多，能够深入的层次就越深，能进入到顶层的概率就会越大。

5.2 应用场景

主要应用于根据某个权重进行排序的队列的场景，比如游戏积分排行榜，设置优先级的任务列表，学生成绩表等。

操作指令

# 添加元素
zadd key score value [score value...]

# 获取集合的值并按照score从小到大排列， 最小的是最上面
zrange key start end 

# 返回有序集 key 中，所有 score 值介于 min 和 max 之间(包括等于 min 或 max )的成员。有序集成员按 score 值递增(从小到大)次序排列, 最小的是最上面
zrangeByScore key score_min score_max 

# 删除
zrem key value 

# 获取key的集合有多少元素
zcard key

# 统计分数从小到大有多少元素 （闭区间）
zcount key score_min score_max 

# 获取value所在位置（从小到大排序，最小的是0）
zrank key value 

# 获取value所在的位置（从大到小排列， 最大的是0）
zrevrank key value

实操

# 插入多条数据和分数并去重及排序
>zadd rank 66 zhangsan 88 lisi 77 wangwu 99 zhaoliu
"4"

# 插入多条数据及分数并去重及排序
>zadd rank 66 zhangsan 88 lisi 77 wangwu 99 zhaoliu
"0"

# 获取下标 0 ~ 3 的数据(左闭右闭)
>zrange rank 0 3
 1)  "zhangsan"
 2)  "wangwu"
 3)  "lisi"
 4)  "zhaoliu"

# 获取分数在 77 ~ 99 之间的数据(左闭右闭)
>zrangeByScore rank 77 99
 1)  "wangwu"
 2)  "lisi"
 3)  "zhaoliu"

# 删除一条数据
>zrem rank zhaoliu
"1"

# 查询元素的个数
>zcard rank
"3"

# 统计分数在 77 ~ 88 之间的数据(左闭右闭)
>zcount rank 77 88
"2"

# 获取指定元素的下标
>zrank rank zhangsan
"0"

# 获取指定元素的下标并反转
>zrevrank rank zhangsan
"2"

6. 补充

下面这些图来自我的好兄弟老王赞助，一个技术很强的全栈专家。

码农公寓

1. 字符串（strings）

1.1 类型介绍

1.2 应用场景

2. 散列（hashes）

2.1 类型介绍

2.2 应用场景

3. 列表（lists）

3.1 类型介绍

3.2 应用场景

4. 集合（sets）

4.1 类型介绍

4.2 应用场景

5. 有序集合（sorted sets）

5.1 类型介绍

5.1.1 跳跃列表

5.2 应用场景

6. 补充

相关文章