协方差的意义和计算公式

原文参考
为什么需要协方差
学过概率论,我们知道均值,方差和标准差,但我们应该注意到,标准差和方差是用来描述一维数据的,现实生活中我们常常遇到含有多维数据的数据集,我们当然可以按照每一位独立的计算方差和标准差,但是通常我们还想了解更多,比如身高与体重这两维是否存在关系,协方差就是这样一种用来度量两个随机变量关系的统计量。
我们可以仿照方差的定义
协方差的意义和计算公式
来度量各个维度偏离其均值的程度,协方差可以这样定义
协方差的意义和计算公式
这个式子的意义:如果结果为正值,则说明两个结果是正相关,即身高越高,体重越重,结果为负值,就说明是负相关的,如果为0,则就是统计上说的独立。
从协方差的定义上,也可以得出一些显而易见的结论,如
协方差的意义和计算公式
协方差多了之后就是协方差矩阵
协方差的意义和计算公式
可见,协方差矩阵是一个对称的矩阵,而且对角线是各个维度上的方差。