哈夫曼树&算法&编码

哈夫曼树

哈夫曼树又称最优二叉树,是一种带权路径长度最短的二叉树。所谓树的带权路径长度,就是树中所有的叶结点的权值乘上其到根结点的路径长度(若根结点为0层,叶结点到根结点的路径长度为叶结点的层数)。树的带权路径长度记为WPL=(W1L1+W2L2+W3L3+…+WnLn),N个权值Wi(i=1,2,…n)构成一棵有N个叶结点的二叉树,相应的叶结点的路径长度为Li(i=1,2,…n)。可以证明哈夫曼树的WPL是最小的。

哈夫曼算法原理:

  • 1.为每个符号建立一个叶子节点,并加上其相应的发生频率

  • 2.当有一个以上的节点存在时,进行下列循环:
    • 把这些节点作为带权值的二叉树的根节点,左右子树为空
    • 选择两棵根结点权值最小的树作为左右子树构造一棵新的二叉树,且至新的二叉树的根结点的权值为其左右子树上根结点的权值之和。
    • 把权值最小的两个根节点移除
    • 将新的二叉树加入队列中.
  • 3.最后剩下的节点暨为根节点,此时二叉树已经完成。
  • 哈夫曼树&算法&编码

哈夫曼编码

在数据通信中,经常需要将传送的的文字转换为二进制字符0、1,组成的二进制字符串,该过程称为编码。
哈夫曼编码可用于构造最短代码长度方案。

哈夫曼编码就是使用哈夫曼二叉树,左节点为0,右节点为1,最后得到该位置的01路径。
哈夫曼编码的实质就是使用次数越多的字符采用的编码越短。

哈夫曼树&算法&编码