我所理解的协方差以及协方差矩阵

文章目录

一、协方差

1、为什么需要协方差
2、协方差的定义

二、协方差矩阵

1、协方差矩阵的定义
2、协方差矩阵公式推导

参考博客

一、协方差

1、为什么需要协方差

定义：假如有N个样本的集合{ $X_1,X_2,...X_N$ }，我们可以定义出以下定义。
我所理解的协方差以及协方差矩阵
标准差是用来描述离散程度，。之所以除以n-1而不是除以n，是因为这样能使我们以较小的样本集更好的逼近总体的标准差，即统计上所谓的“无偏估计”。而方差则仅仅是标准差的平方。
标准差和方差一般是用来描述一维数据的,协方差就是这样一种用来度量两个随机变量关系的统计量

2、协方差的定义

仿照方差的定义
可以这样定义协方差我所理解的协方差以及协方差矩阵

来度量各个维度偏离其均值的程度。
两个或者两个以上的随机变量函数的情况
设 $Z$ 是随机变量 $X,Y$ 的函数 $Z=g(X,Y),$ （ $g$ 是连续函数）,那么 $Z$ 是一个一维随机变量，若二维随机变量 $(X,Y)$ 的概率密度为 $f(x,y)$ ,则有， $E(Z)=E[g(X,Y)]=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y) dxdy$
若 $(X,Y)$ 为离散型随机变量，其分布律为 $P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2,\cdots,$ 则有 $E(Z)=E[g(X,Y)]=\sum_{j=1}^\infty\sum_{i=1}^\infty g(x_i,y_j)p_{ij}$
故有： $cov(X,Y)={\frac{\sum_{i=1}^n(X_i-\overline X)(Y_i-\overline Y)}{n}}=E[(X-E(X))(Y-E(Y))]$
注意这里字母写成n是为了推出期望表达式。

二、协方差矩阵

1、协方差矩阵的定义

矩阵中的数据按行排列与按列排列求出的协方差矩阵是不同的，这里默认数据是按行排列。即每一行是一个observation(or sample)，那么每一列就是一个随机变量。
$X_{m\times n}= \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2}& \cdots & a_{mn} \\ \end{bmatrix}=[c_1,c_2,\cdots,c_n]$
则协方差矩阵为
$\begin{bmatrix} cov(c_1,c_1)&cov(c_1,c_2)&\cdots&cov(c_1,c_n)\\ cov(c_2,c_1)&cov(c_2,c_2)&\cdots&cov(c_2,c_n)\\ \vdots & \vdots & \ddots & \vdots \\ cov(c_n,c_1)&cov(c_n,c_2)&\cdots&cov(c_n,c_n)\\ \end{bmatrix}$
协方差矩阵的维度等于随机变量的个数，即每一个 observation 的维度。

2、协方差矩阵公式推导

协方差矩阵公式推导

参考博客

我所理解的协方差矩阵