Redis 深度历险: 核心原理和应用实践

目录

 

1.Redis 可以做什么? 

2.基础:万丈高楼平地起 ——Redis 基础数据结构 

string (字符串)  

list (列表) 

hash (字典) 

set (集合) 

zset (有序列表)  

容器型数据结构的通用规则 

过期时间 

应用 1:千帆竞发 —— 分布式锁 

分布式锁 


1.Redis 可以做什么? 

Redis 的业务应用范围非常广泛,让我们以掘金技术社区(juejin.im)的帖子模块为实
例,梳理一下,Redis 可以用在哪些地方? 
1、记录帖子的点赞数、评论数和点击数 (hash)。  
2、记录用户的帖子 ID 列表 (排序),便于快速显示用户的帖子列表 (zset)。  
3、记录帖子的标题、摘要、作者和封面信息,用于列表页展示 (hash)。  
4、记录帖子的点赞用户 ID 列表,评论 ID 列表,用于显示和去重计数 (zset)。  
5、缓存近期热帖内容 (帖子内容空间占用比较大),减少数据库压力 (hash)。  
6、记录帖子的相关文章 ID,根据内容推荐相关帖子 (list)。  
7、如果帖子 ID 是整数自增的,可以使用 Redis 来分配帖子 ID(计数器)。  
8、收藏集和帖子之间的关系 (zset)。  
9、记录热榜帖子 ID 列表,总热榜和分类热榜 (zset)。  
10、缓存用户行为历史,进行恶意行为过滤 (zset,hash)

以上提到的只是 Redis 的基础应用,也是日常开发中最常见的应用

2.基础:万丈高楼平地起 ——Redis 基础数据结构 

Redis 基础数据结构 :  Redis 有 5 种基础数据结构,分别为:string (字符串)、list (列表)、set (集合)、hash (哈
希) 和 zset (有序集合)。

string (字符串)  


字符串 string 是 Redis 最简单的数据结构。Redis 所有的数据结构都是以唯一的 key 
字符串作为名称,然后通过这个唯一 key 值来获取相应的 value 数据。不同类型的数据结
构的差异就在于 value 的结构不一样。  

字符串结构使用非常广泛,一个常见的用途就是缓存用户信息。我们将用户信息结构体
使用 JSON 序列化成字符串,然后将序列化后的字符串塞进 Redis 来缓存。同样,取用户
信息会经过一次反序列化的过程。 

Redis 的字符串是动态字符串,是可以修改的字符串,内部结构实现上类似于 Java 的 
ArrayList,采用预分配冗余空间的方式来减少内存的频繁分配,如图中所示,内部为当前字
符串实际分配的空间 capacity 一般要高于实际字符串长度 len。当字符串长度小于 1M 时,
扩容都是加倍现有的空间,如果超过 1M,扩容时一次只会多扩 1M 的空间
。需要注意的是
字符串最大长度为 512M

过期和 set 命令扩展

 可以对 key 设置过期时间,到点自动删除,这个功能常用来控制缓存的失效时间

> set name codehole  > get name "codehole"  > expire name 5 # 5s 后过期  ... # wait for 5s  > get name  (nil)  > setex name 5 codehole # 5s 后过期,等价于 set+expire  > get name  "codehole"  ... # wait for 5s  > get name  (nil)

计数

如果 value 值是一个整数,还可以对它进行自增操作。自增是有范围的,它的范围是 
signed long 的最大最小值,超过了这个值,Redis 会报错。 
> set age 30  OK  > incr age  (integer) 31  > incrby age 5  (integer) 36  > incrby age -5  (integer) 31 

list (列表) 

Redis 的列表相当于 Java 语言里面的 LinkedList,注意它是链表而不是数组。这意味着 
list 的插入和删除操作非常快,时间复杂度为 O(1),但是索引定位很慢,时间复杂度为 
O(n),这点让人非常意外。

Redis 的列表结构常用来做异步队列使用。将需要延后处理的任务结构体序列化成字符
串塞进 Redis 的列表,另一个线程从这个列表中轮询数据进行处理

Redis 深度历险: 核心原理和应用实践

慢操作 

lindex 相当于 Java 链表的 get(int index)方法,它需要对链表进行遍历,性能随着参数
index 增大而变差。 ltrim 和字面上的含义不太一样,个人觉得它叫 lretain(保留) 更合适一
些,因为 ltrim 跟的两个参数 start_index 和 end_index 定义了一个区间,在这个区间内的值,
ltrim 要保留,区间之外统统砍掉。我们可以通过 ltrim 来实现一个定长的链表,这一点非常
有用。index 可以为负数,index=-1 表示倒数第一个元素,同样 index=-2 表示倒数第二个元
。  

Redis 深度历险: 核心原理和应用实践

快速列表

如果再深入一点,你会发现 Redis 底层存储的还不是一个简单的 linkedlist,而是称之为
快速链表 quicklist 的一个结构

hash (字典) 

Redis 的字典相当于 Java 语言里面的 HashMap,它是无序字典。内部实现结构上同 
Java 的 HashMap 也是一致的,同样的数组 + 链表二维结构。第一维 hash 的数组位置碰撞
时,就会将碰撞的元素使用链表串接起来。 
 不同的是,Redis 的字典的值只能是字符串,另外它们 rehash 的方式不一样,因为 
Java 的 HashMap 在字典很大时,rehash 是个耗时的操作,需要一次性全部 rehash。Redis 
为了高性能,不能堵塞服务,所以采用了渐进式 rehash 策略

渐进式 rehash 会在 rehash 的同时,保留新旧两个 hash 结构,查询时会同时查询两个 
hash 结构,然后在后续的定时任务中以及 hash 的子指令中,循序渐进地将旧 hash 的内容
一点点迁移到新的 hash 结构中
hash 结构也可以用来存储用户信息,不同于字符串一次性需要全部序列化整个对象,
hash 可以对用户结构中的每个字段单独存储。这样当我们需要获取用户信息时可以进行部分
获取。
而以整个字符串的形式去保存用户信息的话就只能一次性全部读取,这样就会比较浪
费网络流量。 

hash 也有缺点,hash 结构的存储消耗要高于单个字符串,到底该使用 hash 还是字符
串,需要根据实际情况再三权衡

 Redis 深度历险: 核心原理和应用实践

同字符串一样,hash 结构中的单个子 key 也可以进行计数,它对应的指令是 hincrby,
和 incr 使用基本一样

set (集合) 

Redis 的集合相当于 Java 语言里面的 HashSet,它内部的键值对是无序的唯一的。它的
内部实现相当于一个特殊的字典,字典中所有的 value 都是一个值 NULL

当集合中最后一个元素移除之后,数据结构自动删除,内存被回收。 set 结构可以用来
存储活动中奖的用户 ID,因为有去重功能,可以保证同一个用户不会中奖两次

Redis 深度历险: 核心原理和应用实践

zset (有序列表)  

zset 可能是 Redis 提供的最为特色的数据结构,它也是在面试中面试官最爱问的数据结
构。它类似于 Java 的 SortedSet 和 HashMap 的结合体,一方面它是一个 set,保证了内部 
value 的唯一性,另一方面它可以给每个 value 赋予一个 score,代表这个 value 的排序权
重。它的内部实现用的是一种叫着「跳跃列表」的数据结构。 

zset 可以用来存
粉丝列表,value 值是粉丝的用户 ID,score 是关注时间。我们可以对粉丝列表按关注时间
进行排序。 

zset 还可以用来存储学生的成绩,value 值是学生的 ID,score 是他的考试成绩。我们
可以对成绩按分数进行排序就可以得到他的名次

Redis 深度历险: 核心原理和应用实践

跳跃列表(类似java的跳表Skiplist)

zset 内部的排序功能是通过「跳跃列表」数据结构来实现的,它的结构非常特殊,也比
较复杂。 
因为 zset 要支持随机的插入和删除,所以它不好使用数组来表示。我们先看一个普通的
链表结构。 

跳跃列表就是类似于这种层级制,最下面一层所有的元素都会串起来。然后每隔几个元
素挑选出一个代表来,再将这几个代表使用另外一级指针串起来。然后在这些代表里再挑出
二级代表,再串起来。最终就形成了金字塔结构。 

Redis 深度历险: 核心原理和应用实践

容器型数据结构的通用规则 

list/set/hash/zset 这四种数据结构是容器型数据结构,它们共享下面两条通用规则:

1、create if not exists  
如果容器不存在,那就创建一个,再进行操作。比如 rpush 操作刚开始是没有列表的,
Redis 就会自动创建一个,然后再 rpush 进去新元素。  
2、drop if no elements  
如果容器里元素没有了,那么立即删除元素,释放内存。这意味着 lpop 操作到最后一
个元素,列表就消失了。

过期时间 

Redis 所有的数据结构都可以设置过期时间,时间到了,Redis 会自动删除相应的对象。
需要注意的是过期是以对象为单位,比如一个 hash 结构的过期是整个 hash 对象的过期,
而不是其中的某个子 key。  
还有一个需要特别注意的地方是如果一个字符串已经设置了过期时间,然后你调用了 
set 方法修改了它,它的过期时间会消失

Redis 深度历险: 核心原理和应用实践

应用 1:千帆竞发 —— 分布式锁 

分布式应用进行逻辑处理时经常会遇到并发问题。 
比如一个操作要修改用户的状态,修改状态需要先读出用户的状态,在内存里进行修
改,改完了再存回去。如果这样的操作同时进行了,就会出现并发问题,因为读取和保存状
态这两个操作不是原子的。(Wiki 解释:所谓原子操作是指不会被线程调度机制打断的操
作;这种操作一旦开始,就一直运行到结束,中间不会有任何 context switch 线程切换。) 
 这个时候就要使用到分布式锁来限制程序的并发执行。Redis 分布式锁使用非常广泛,
它是面试的重要考点之一

分布式锁 
 

分布式锁本质上要实现的目标就是在 Redis 里面占一个“茅坑”,当别的进程也要来占
时,发现已经有人蹲在那里了,就只好放弃或者稍后再试。 
占坑一般是使用 setnx(set if not exists) 指令,只允许被一个客户端占坑。先来先占, 用
完了,再调用 del 指令释放茅坑

Redis 深度历险: 核心原理和应用实践

但是有个问题,如果逻辑执行到中间出现异常了,可能会导致 del 指令没有被调用,这样
就会陷入死锁,锁永远得不到释放。 

于是我们在拿到锁之后,再给锁加上一个过期时间,比如 5s,这样即使中间出现异常也
可以保证 5 秒之后锁会自动释放

Redis 深度历险: 核心原理和应用实践

但是以上逻辑还有问题。如果在 setnx 和 expire 之间服务器进程突然挂掉了,可能是因
为机器掉电或者是被人为杀掉的,就会导致 expire 得不到执行,也会造成死锁。

为了解决这个疑难,Redis 开源社区涌现了一堆分布式锁的 library,专门用来解决这个问
题。实现方法极为复杂,小白用户一般要费很大的精力才可以搞懂。如果你需要使用分布式锁,
意味着你不能仅仅使用 Jedis 或者 redis-py 就行了,还得引入分布式锁的 library。 

Redis 深度历险: 核心原理和应用实践

 为了治理这个乱象,Redis 2.8 版本中作者加入了 set 指令的扩展参数,使得 setnx 和 
expire 指令可以一起执行,彻底解决了分布式锁的乱象。从此以后所有的第三方分布式锁 
library 可以休息了。 > set lock:codehole true ex 5 nx OK ... do something critical ... > del 
lock:codehole 上面这个指令就是 setnx 和 expire 组合在一起的原子指令,它就是分布式锁的
奥义所在

P26