jpeg压缩简单介绍及huffman table

一、jpeg压缩流程的简单介绍

jpeg压缩是基于YUV颜色空间进行压缩编码的,首先将RGB转化成YUV,然后将像素值减去128,转化到范围-128~127。后要进行采样,一般来说有3中采样方式:4:4:4,4:2:2和4:1:1;4:4:4即不进行下采样,4:1:1是指一个2x2的单元,采样4个Y,1个V和1个U(具体想了解采样的可以看下其它博客)。后直接进行8x8的DCT变换,将时域像素值转化到频域。后根据参数quality(质量因子或压缩因子)进行量化。量化之后按zigzag扫描之后进行编码。

二、量化,质量因子

jpeg压缩有两张固定的8x8的量化表,压缩时根据指定的质量因子计算其具体的量化系数进行量化,质量因子范围1~100。当质量因子是100时,量化因子都是1,质量因子是1是最大程度的压缩。libjpeg中默认量化表分别是亮度量化表、色度量化表。
亮度默认量化表:
[ 16, 11, 10, 16, 24, 40, 51, 61,
12, 12, 14, 19, 26, 58, 60, 55,
14, 13, 16, 24, 40, 57, 69, 56,
14, 17, 22, 29, 51, 87, 80, 62,
18, 22, 37, 56, 68, 109, 103, 77,
24, 35, 55, 64, 81, 104, 113, 92,
49, 64, 78, 87, 103, 121, 120, 101,
72, 92, 95, 98, 112, 100, 103, 99]
色度默认量化表:
[ 17, 18, 24, 47, 99, 99, 99, 99,
18, 21, 26, 66, 99, 99, 99, 99,
24, 26, 56, 99, 99, 99, 99, 99,
47, 66, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99,
99, 99, 99, 99, 99, 99, 99, 99]

当然,也可以自定义量化表。

三、编码

在baseline的JPEG系统中采用Canonical Huffman Code(范式哈夫曼编码)。jpeg对DC系数和AC系数采用不同的编码方法。

DC:

DC系数采用差分编码,即编码当前DC系数与前一个DC系数的差。比如编码2,3,4,5这4个DC系数;则要编码的系数为2,1,1,1。后进一步将编码系数转化成中间格式,即(长度,幅值)。幅值就是当前要编码的系数,比如第一个系数2,而长度是将幅值进行VLI编码需要的bit长度,VLI是变长整数编码,具体编码方式如下图所示。2编码需要2个bit,所以2的中间格式是(2,2)。然后对长度进行haffman编码,对幅值进行VLI编码。
jpeg压缩简单介绍及huffman table

AC:

在编码时AC系数经过zigzag扫描方式得到一维63个系数,因为AC系数中有很多0,所以采用行程长度编码(RLC)方法来进一步降低压缩率。行程长度编码是指用两个系数来表示一串字符中重复出现的字符,比如重复出现5个0,就可以用(5,0)来表示,第一个系数表示重复出现的次数,第二个系数表示重复出现的字符。
而在AC系数编码中采用上述的思想,也是得到(行程长度,系数)数据对的形式,值不过行程长度是指当前要编码的非零系数与前一个非零系数之间0的个数。比如一串AC系数为:-1,0,0,2,1
中间形式为(0,-1),(2,2),(0,1)。第一个非零系数为-1,前面没有另,所以行程长度为0;第二个非零系数是2,与前一个非零系数-1之间有2个0,所以行程长度是2。
对于上述中间形式,需要进一步分解,与DC系数编码相同,把要编码的非零系数进行VLI编码,进一步拆分为(长度,幅值)。所以AC系数编码,一个非零系数要编3个值((行程长度,长度),幅值))。所以上例的最终中间格式为:(0,1),-1,(2,2),2,(0,1),1。对最后的幅值进行VLI编码,对(行程长度,长度)进行huffman编码。

huffman表

jpeg压缩有4张默认huffman表,DC系数和AC系数使用不同的huffman表;亮度和色度使用不同的huffman表。分别为:dc_luminance,dc_chrominanc,ac_luminance,ac_chrominanc。
它们在libjpeg中相关数据如下:
static const UINT8 bits_dc_luminance[17] =
{ /* 0-base */ 0, 0, 1, 5, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0 };
static const UINT8 val_dc_luminance[] =
{ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 };

static const UINT8 bits_dc_chrominance[17] =
{ /* 0-base */ 0, 0, 3, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0 };
static const UINT8 val_dc_chrominance[] =
{ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 };

static const UINT8 bits_ac_luminance[17] =
{ /* 0-base */ 0, 0, 2, 1, 3, 3, 2, 4, 3, 5, 5, 4, 4, 0, 0, 1, 0x7d };
static const UINT8 val_ac_luminance[] =
{ 0x01, 0x02, 0x03, 0x00, 0x04, 0x11, 0x05, 0x12,
0x21, 0x31, 0x41, 0x06, 0x13, 0x51, 0x61, 0x07,
0x22, 0x71, 0x14, 0x32, 0x81, 0x91, 0xa1, 0x08,
0x23, 0x42, 0xb1, 0xc1, 0x15, 0x52, 0xd1, 0xf0,
0x24, 0x33, 0x62, 0x72, 0x82, 0x09, 0x0a, 0x16,
0x17, 0x18, 0x19, 0x1a, 0x25, 0x26, 0x27, 0x28,
0x29, 0x2a, 0x34, 0x35, 0x36, 0x37, 0x38, 0x39,
0x3a, 0x43, 0x44, 0x45, 0x46, 0x47, 0x48, 0x49,
0x4a, 0x53, 0x54, 0x55, 0x56, 0x57, 0x58, 0x59,
0x5a, 0x63, 0x64, 0x65, 0x66, 0x67, 0x68, 0x69,
0x6a, 0x73, 0x74, 0x75, 0x76, 0x77, 0x78, 0x79,
0x7a, 0x83, 0x84, 0x85, 0x86, 0x87, 0x88, 0x89,
0x8a, 0x92, 0x93, 0x94, 0x95, 0x96, 0x97, 0x98,
0x99, 0x9a, 0xa2, 0xa3, 0xa4, 0xa5, 0xa6, 0xa7,
0xa8, 0xa9, 0xaa, 0xb2, 0xb3, 0xb4, 0xb5, 0xb6,
0xb7, 0xb8, 0xb9, 0xba, 0xc2, 0xc3, 0xc4, 0xc5,
0xc6, 0xc7, 0xc8, 0xc9, 0xca, 0xd2, 0xd3, 0xd4,
0xd5, 0xd6, 0xd7, 0xd8, 0xd9, 0xda, 0xe1, 0xe2,
0xe3, 0xe4, 0xe5, 0xe6, 0xe7, 0xe8, 0xe9, 0xea,
0xf1, 0xf2, 0xf3, 0xf4, 0xf5, 0xf6, 0xf7, 0xf8,
0xf9, 0xfa };

static const UINT8 bits_ac_chrominance[17] =
{ /* 0-base */ 0, 0, 2, 1, 2, 4, 4, 3, 4, 7, 5, 4, 4, 0, 1, 2, 0x77 };
static const UINT8 val_ac_chrominance[] =
{ 0x00, 0x01, 0x02, 0x03, 0x11, 0x04, 0x05, 0x21,
0x31, 0x06, 0x12, 0x41, 0x51, 0x07, 0x61, 0x71,
0x13, 0x22, 0x32, 0x81, 0x08, 0x14, 0x42, 0x91,
0xa1, 0xb1, 0xc1, 0x09, 0x23, 0x33, 0x52, 0xf0,
0x15, 0x62, 0x72, 0xd1, 0x0a, 0x16, 0x24, 0x34,
0xe1, 0x25, 0xf1, 0x17, 0x18, 0x19, 0x1a, 0x26,
0x27, 0x28, 0x29, 0x2a, 0x35, 0x36, 0x37, 0x38,
0x39, 0x3a, 0x43, 0x44, 0x45, 0x46, 0x47, 0x48,
0x49, 0x4a, 0x53, 0x54, 0x55, 0x56, 0x57, 0x58,
0x59, 0x5a, 0x63, 0x64, 0x65, 0x66, 0x67, 0x68,
0x69, 0x6a, 0x73, 0x74, 0x75, 0x76, 0x77, 0x78,
0x79, 0x7a, 0x82, 0x83, 0x84, 0x85, 0x86, 0x87,
0x88, 0x89, 0x8a, 0x92, 0x93, 0x94, 0x95, 0x96,
0x97, 0x98, 0x99, 0x9a, 0xa2, 0xa3, 0xa4, 0xa5,
0xa6, 0xa7, 0xa8, 0xa9, 0xaa, 0xb2, 0xb3, 0xb4,
0xb5, 0xb6, 0xb7, 0xb8, 0xb9, 0xba, 0xc2, 0xc3,
0xc4, 0xc5, 0xc6, 0xc7, 0xc8, 0xc9, 0xca, 0xd2,
0xd3, 0xd4, 0xd5, 0xd6, 0xd7, 0xd8, 0xd9, 0xda,
0xe2, 0xe3, 0xe4, 0xe5, 0xe6, 0xe7, 0xe8, 0xe9,
0xea, 0xf2, 0xf3, 0xf4, 0xf5, 0xf6, 0xf7, 0xf8,
0xf9, 0xfa };