数据结构和算法5(树、图)
赫夫曼树
树节点间连线相关的树叫做权(频数)。
结点的路径长度:从根节点到该节点的路径上的连接数。
树的路径长度:树中每个叶子结点的路径长度之和。
结点带权路径长度:节点的路径长度和结点取值的乘积。
树的带权路径长度(WPL):树中所有叶子结点的带权路径长度之和。
树的带权路径长度越小,二叉树性能越好。
WPL最小时,就是最优二叉树,也是赫夫曼树。
怎么构造赫夫曼树?
在森林中选出两棵根节点的权值最小的二叉树,小的放左边,大的放右边。合并两棵选出的二叉树,增加一个新结点作为二叉树的跟,权值为左右孩子的权值之和。
再从森林里选出最小的,5<6放6的左边,否则放右边
最后
赫夫曼编码
定长编码:ASCII
变长编码:单个编码的长度不一致,可以根据整体出现频率来调节。
前缀码:没有任何码是其他码的前缀
将每个字符的出现频率作为字符结点的权值赋予叶子结点,每个分支结点的左右分支分别用0和1编码,从树根结点到每个叶子结点的路径上所经分支的0、1编码序列等于该叶子结点的二进制编码