20200407 NoSQL笔记（六）

第六章 LevelDb——Google的Key-Value数据库
一、 LevelDb简介

二、 LevelDb的静态部分
20200407 NoSQL笔记（六）

SSTable中的文件按照Key字典序排序，具有层级结构；
SSTable中Level 0层级内的.sst文件具有特殊性；
.sst文件的逻辑布局：划分为数据存储区和数据管理区；
a) 数据存储区存放键值数据；
b) 数据管理区提供索引指针等管理数据
Block：
a) 每个Block分为三个部分：数据存储区，数据存储类型，数据校验码
b) Block内容与Block尾部；Block尾部的“重启点”（Restart Point）（相邻的两条记录很可能Key部分存在重叠）
Index：
a) 数据索引区的每条记录是对某个Data Block建立的索引信息；
b) 每条索引信息包含三个内容：
 第一个字段记载大于等于数据块i中最大key值，小于数据块i+1中最小Key值;
 第二个字段指出数据块i在.sst文件中的起始位置；
 第三个字段指出数据块i的大小
Footer：
a) metaindex_handle指出了metaindex block的起始位置和大小
b) inex_handle指出了index Block的起始地址和大小；

log文件主要用于系统崩溃恢复而不丢失数据；
LevelDb对于一个Log文件，会把它切割成以32K为单位的物理Block，每次读取的单位以一个Block作为基本读取单位；一个log文件由三个连续的32KB大小的Block构成
在应用的视野里是看不到Block，应用看到的是一系列的Key: Value对；在LevelDb内部，会将一个Key: Value对看作一条记录；
在每条记录的数据前增加一个记录头，用来记载一些管理信息；记录头包含三个字段：CheckSum（校验码），记录长度，类型；类型可以分为FULL，FIRST，MIDDLE，LAST

三、 LevelDb的动态部分

写入记录或者是插入操作，分为两个步骤：
a) 记录以顺序写的方式追加到log文件的末尾；
b) 记录插入内存中MemTable中，插入规则遵循跳表算法（SkipList）
删除操作插入的是“Key：删除标记”，并不能真正的删除记录

小压缩的目的是当内存中的MemTable大小到了一定值时，将内容保存到磁盘文件中；
大压缩是当某个Level下的SSTable文件数目超过一定设置值之后，LevelDB会从这个Level的SSTable中选择一个文件，将其和更高一层级的level+1的SSTable文件合并
a) Level 0在文件选择的时候，可能会有多个文件参与大压缩；
b) Level 选择文件压缩的顺序是字典序，即如果选择文件A压缩，那么下一个文件就是与文件A的键范围紧挨着的文件B压缩，这样每个文件都有机会和高层Level文件进行合并