HEVC帧内预测学习(三)代价计算

1.DCT矩阵变换

1.1.原理

所谓DCT变换,就是离散余弦变换,通常在信号中变换的作用是将时域下的信号转换为频域,以便于更方便的分析不同频域上的数值,进而分析其能量分布。以下为八种DCT变换方式。HEVC帧内预测学习(三)代价计算
HEVC帧内预测学习(三)代价计算
参考II类公式,当k=0时,X(k)就是直流分量,而k越大,也就是说频率越大,其对应的X(k)所表示的数值,就是数字信号该频率分量下的能量,所以对于相关性越强的信号,信号变化就越缓慢,X(0)一般就越大,而对于k>0部分的分量,就会很小。
而在我们的视频图像中,则是将其在空域上的离散数字信号转换到频域上,这里对空域的理解可以以坐标大小看做时间进行理解。下图为一个一维空间序列的信号分析。HEVC帧内预测学习(三)代价计算HEVC帧内预测学习(三)代价计算
HEVC帧内预测学习(三)代价计算
从DCT变换后的X(k)可以直观的看出,X1(k)比较乱,就是各个频率分量都参差不齐,且其X1(0)也比较小,所以可以看出该序列信号相关性差,幅值差异较大。而对于X2(k),其DC系数相对于AC系数很大,且各个交流分量能量差异较小,因此可看出其信号相关性较好,且幅值差异较小。
名词解释:DC系数就是直流分量,AC系数就是交流分量。

1.2.二维图像DCT变换

对于二维的DCT变换与一维类似,而这时区分低频高频就是看坐标位置了,在左上角的位置的频率较低,也就是低频,对于第一行和第一列,其值应当是对应行方向上的直流分量与列方向上的直流分量。(1,1)就是直流分量,因此离左上角越远,频率就越大。

1.3. 哈达玛变换

哈达玛变换性质:
① 所有元素均为1,且其特征值也只有1。
② 为正交、对称矩阵,相应的变换为正交变换。
③ 奇数行(列)偶对称,偶数行(列)奇对称。
④ 变换前后能量守恒。
哈达玛变换后的所有值的绝对值之和(SATD)与DCT变换后所有值的绝对值之和非常接近,且计算起来是只有加减运算的,复杂度较低,因此在快速模式遍历,选择最佳预测模式时,在HEVC中一般都是用哈达玛变换,得到SATD来代替DCT变换反映残差在频域中的大小。
问题:为什么可以去除相关性。
SATD计算:其中H就是哈达玛矩阵,X是残差矩阵。SATD就是将残差矩阵进行哈达玛变换,然后将变换后的矩阵的每一个元素绝对值相加。
HEVC帧内预测学习(三)代价计算