Linux内核链表之hlist_head
Linux内核链表之哈希表
(include/linux/list.h)
1、定义以及初始化
//hash桶的头结点
struct hlist_head {
struct hlist_node *first; //指向每一个hash桶的第一个结点的指针
};
//hash桶的普通结点
struct hlist_node {
struct hlist_node *next, **pprev;//next指向下一个结点的指针
//pprev指向上一个结点的next指针的地址
};
来看一张简单的hash表的图:
hlist_head结构体只有一个域,即first。 first指针指向该hlist链表的第一个节点。
hlist_node结构体有两个域,next 和pprev。 next指针很容易理解,它指向下个hlist_node结点,倘若该节点是链表的最后一个节点,next指向NULL。
pprev是一个二级指针, 它指向前一个节点的next指针的地址。
为什么我们需要这样一个指针呢?它的好处是什么?
在回答这个问题之前,我们先研究另一个问题:为什么哈希表的实现需要两个不同的数据结构?
哈希表的目的是为了方便快速的查找,所以哈希表中hash桶的数量通常比较大,否则“冲突”的概率会非常大,这样也就失去了哈希表的意义。如何做到既能维护一张大表,又能不使用过多的内存呢?就只能从数据结构上下功夫了。所以对于哈希表的每个hash桶,它的结构体中只存放一个指针,解决了占用空间的问题。现在又出现了另一个问题:数据结构不一致。显然,如果hlist_node采用传统的next,prev指针,对于第一个节点和后面其他节点的处理会不一致。这样并不优雅,而且效率上也有损失。
hlist_node巧妙地将pprev指向上一个节点的next指针的地址,由于hlist_head的first域指向的结点类型和hlist_node指向的下一个结点的结点类型相同,这样就解决了通用性。
如果要删除hash桶对应链表中的第一个普通结点
static inline void __hlist_del(struct hlist_node *n)
{
struct hlist_node *next = n->next;//获取指向第二个普通结点的指针
struct hlist_node **pprev = n->pprev;//保留待删除的第一个结点的pprev域(即头结点first域的地址),此时 pprev = &first
*pprev = next;
/*
因为pprev = &first,所以*pprev = next,相当于 first = next
即将hash桶的头结点指针指向原来的第二个结点,如上图中的黑线1
*/
if (next) //如果第二个结点不为空
next->pprev = pprev;//将第二个结点的pprev域设置为头结点first域的地址,如上图中的黑线2
}
如果要删除hash桶对应链表中的非第一个结点
static inline void __hlist_del(struct hlist_node *n)
{
struct hlist_node *next = n->next;//获取指向待删除结点的下一个普通结点的指针
struct hlist_node **pprev = n->pprev;//获取待删除结点的pprev域
*pprev = next; //修改待删除结点的pprev域,逻辑上使待删除结点的前驱结点指向待删除结点的后继结点,如上图中的黑线1
if (next) //如果待删除结点的下一个普通结点不为空
next->pprev = pprev;//设置下一个结点的pprev域,如上图中的黑线2,保持hlist的结构
}
可以看到删除第一个普通结点和删除非第一个普通结点的代码是一样的。
大概了解下hlist相关的概念,完整代码位于include/linux/list.h