Redis-字符串源码原理

1、Redis的字符串结构被设计成一个[SDS]结构，字符串实际内容是被存放在一个数组中，如下表

struct SDS<T> {

T capacity; // 数组容量

T len; // 数组实际长度

byte flags; // 特殊标识位，不理睬它

byte[] content; // 数组内容

}

当字符串的大小超出当前分配的capacity大小时，数组将扩容，分配更大的数组，将旧的数组拷贝到新数组中，再将增加到字符串添加进去。

2、embstr 与raw

1）Redis的字符串的储存方式分为2种，当长度特别短时，使用emb形式存储，当长度超出44时，使用raw存储。

2）俩者的区别：

Redis的对象头结构如下：

struct RedisObject {

int4 type; // 4bits

int4 encoding; // 4bits

int24 lru; // 24bits

int32 refcount; // 4bytes

void *ptr; // 8bytes，64-bit system

} robj;

解析：不同的对象具有不同类型的type；同一个类型的type会有不同的存储形式encoding；使用lru来记录对象的LRU信息，每个对象都有一个引用计数，当计数为0的时候，对象就会被销毁，内存被回收；pre指针用来指示对象内容具体存储位置；上诉对象有结构内容加起来需要占用16字节的存储空间。

SDS对象头大小：实际内容的大小(capacity) + 3byte，3是用来存储capacity + len + flags内容加起来的长度，而content数组初始值是16，所有SDS最小的大小是19 (16+3 )；

存储形式如下图：

Redis-字符串源码原理

解析：embstr将RedisObject对象头和SDS对象连续存在一起，使用malloc方法一次分配；而raw需要俩次malloc，俩个对象头砸死内存地址上一般是不连续的。embstr最大能容纳的字符串长度是44字节

3、扩容策略

字符串在长度小于1M之前，扩容空间采用加倍策略，即保留100%冗余空间。当长度大于1M，没次扩容只会多分配1M的冗余空间。