多维高斯分布

1.一维高斯分布

\qquad在介绍二维高斯分布之前我们先介绍一下一维高斯分布的函数图像,如下所示:
f(x)=12πδe(xμ)22δ2 f(x)= \frac{1}{\sqrt{2 \pi}\cdot \delta}\cdot e^{-\frac{{(x-\mu)}^2}{2\delta^2}}
其中μ\mu代表均值,δ\delta代表标准差,其图案如下所示:
多维高斯分布

2.二维高斯分布

\qquad上边我们介绍了一维的高斯分布,接下来我们介绍一下二维高斯分布,首先贴出其函数表达式,为了简单起见,以下的推导我假设所有变量都是相对独立的,且都服从高斯分布,也就是对于概率分布函数f(x0x1,,xn)f(x_0,x_1,\cdot\cdot\cdot\cdot,x_n)而言,存在以下等式:
f(x0x1,,xn)=f(x0)f(x1)f(xn) f(x_0,x_1,\cdot\cdot\cdot\cdot,x_n)=f(x_0)\cdot f(x_1)\cdot\cdot\cdot\cdot f(x_n)
式中的f(xi)f(x_i)服从一维的高斯分布
f(xi)=12πδie(xμi)22δi2 f(x_i)= \frac{1}{\sqrt{2 \pi}\cdot \delta_i}\cdot e^{-\frac{{(x-\mu_i)}^2}{2\delta_i^2}}
\qquad其中δi\delta_iμi\mu_i是第i个变量的标准差和均值。那当我们来描述二维的高斯分布的话,此处我们的nn取值为2。因为x1x_1x2x_2是相互独立的,所以二维的高斯分布函数可以表示为:
f(x1,x2)=f(x1)f(x2)=12πδ1e(xμ1)22δ1212πδ2e(xμ2)22δ22=12πδ1δ2e[δ22(x1μ1)2+δ12(x2μ2)2]2δ12δ22 f(x_1,x_2)=f(x_1)\cdot f(x_2)\\ \qquad\qquad\qquad\quad\quad\qquad\qquad\qquad=\frac{1}{\sqrt{2 \pi}\cdot \delta_1}\cdot e^{-\frac{{(x-\mu_1)}^2}{2\delta_1^2}}\cdot \frac{1}{\sqrt{2 \pi}\cdot \delta_2}\cdot e^{-\frac{{(x-\mu_2)}^2}{2\delta_2^2}}\\ \quad\\\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad\quad=\frac{1}{{2 \pi}\cdot \delta_1 \delta_2}\cdot e^{-\frac{[\delta_2^2{(x_1-\mu_1)}^2+\delta_1^2{(x_2-\mu_2)}^2]}{2\delta_1^2\delta_2^2}}
\qquad其二维的高斯分布的图像如下所示:
多维高斯分布

3.多维高斯分布

\qquad前边我们介绍了一维的和二维的高斯分布,并且画出了其图像,想必大家也在其它的资料中看到过,通过一维和二维扩展出来的多维的高斯分布的表达公式,就像这样:
N(Xμ)=1(2π)D212e(Xμ)T1(Xμ)2 N(\vec{X}\mid\vec{\mu})=\frac{1}{{(2\pi)}^{\frac{D}{2}}\cdot {\mid \sum\mid}^{\frac{1}{2}}}\cdot e^{-\frac{({\vec{X}-\vec{\mu})}^T\cdot{\sum^{-1}}\cdot{({\vec{X}-\vec{\mu})}}}{2}}
\qquad式中各个参数代表的意思如下:

  1. X\vec{X}表示维度为D的向量,
  2. μ\vec{\mu}是由多个变量x1,x2,x3xnx_1,x_2,x_3\cdot\cdot\cdot x_n各自的均值uiu_i组成的向量,
  3. \sum代表所有向量的协方差矩阵,是一个n维n列的矩阵,
  4. 1\sum^{-1}代表协方差矩阵的逆,也是一个n维n列的矩阵。

\qquad讲到这里感觉对于这个多维的公式中的理解还是不是特别透彻,那么我们可以这么想,既然超过二维的原理上来讲已经算是多维的高斯分布了,那么我们能不能通过第三节的公式推导出第二节的二维高斯分布的函数呢?答案当然是可以:
\qquad因为要证明的是二维的情况,所以我们根据上边列出的各个向量分别得到:
X=[x1x2]  μ=[μ1μ2] \vec{X}=\left[ \begin{matrix} x_1 \\ x_2 \end{matrix} \right]\ \ \qquad\vec{\mu}=\left[ \begin{matrix} \mu_1 \\ \mu_2 \end{matrix} \right]
\qquad式中x1x_1x2x_2均是长度为n的序列,因为是二维的情况下,所以我们不妨先去求一下协方差矩阵\sum,根据已学知识,我们知道其表达式如下:
=[δ11δ12δ21δ22]=[DX1Cov(X1,X2)Cov(X2,X1)DX2]=[δ12δ12δ21δ22] \sum=\left[ \begin{matrix} \delta_{11} & \delta_{12}\\ \delta_{21} & \delta_{22} \end{matrix} \right] =\left[ \begin{matrix} DX_1 & Cov(X_1,X_2)\\ Cov(X_2,X_1)& DX_2 \end{matrix} \right] =\left[ \begin{matrix} \delta_{1} ^2& \delta_{12}\\ \delta_{21} & \delta_{2}^2 \end{matrix} \right]
\qquad又因为我们假设x1x_1x2x_2是相互独立的,也就是有δ12=δ21=0\delta_{12}=\delta_{21}=0,于是协方差矩阵即可简化为;
=[δ1200δ22] \sum=\left[ \begin{matrix} \delta_{1} ^2& 0\\ 0& \delta_{2}^2 \end{matrix} \right]
\qquad据此我们即可算得协方差的行列式=δ12δ22\mid \sum\mid={\delta_1}^2{\delta_2}^2,又因为我们选取得是二维高斯分布,所以D取值为2,于是我们将其带入多维高斯分布得左半部分可得;
1(2π)D212=1(2π)δ12δ2212=12πδ1δ2 \frac{1}{{(2\pi)}^{\frac{D}{2}}\cdot {\mid \sum\mid}^{\frac{1}{2}}}=\frac{1}{{(2\pi)}\cdot {\mid{\delta_1}^2{\delta_2}^2\mid}^{\frac{1}{2}}}=\frac{1}{{2 \pi}\cdot \delta_1 \delta_2}
\qquad可见左半部分是和二维分布得函数吻合得的,接下来就进行验证多维分布的右半部分是否与二维的分布相同。
\qquad通过上边的部分,我们很轻易即可得到协方差矩阵的逆1\sum^{-1},其值如下:
1=1δ12δ22[δ2200δ12] {\sum}^{-1}=\frac{1}{\delta_1^2\delta_2^2}\cdot\left[ \begin{matrix} \delta_{2} ^2& 0\\ 0& \delta_{1}^2 \end{matrix} \right]
\qquad于是我们将我们已知的变量带入即可得到:
e(Xμ)T1(Xμ)2=e12[x1μ1x2μ2]1δ12δ22[δ2200δ12][x1μ1x2μ2]=e12δ12δ22[x1μ1x2μ2][δ2200δ12][x1μ1x2μ2]=e12δ12δ22[δ22(x1μ1)δ12(x2μ2)][x1μ1x2μ2]=e12δ12δ22[δ22(x1μ1)2+δ12(x2μ2)2] e^{-\frac{({\vec{X}-\vec{\mu})}^T\cdot{\sum^{-1}}\cdot{({\vec{X}-\vec{\mu})}}}{2}}=e^{-\frac{1}{2}\cdot \left[ \begin{matrix} x_1-\mu_1& x_2-\mu_2\end{matrix} \right]\cdot\frac{1}{\delta_1^2\delta_2^2}\cdot\left[ \begin{matrix} \delta_{2} ^2& 0\\ 0& \delta_{1}^2 \end{matrix} \right]\cdot\left[ \begin{matrix} x_1-\mu_1\\ x_2-\mu_2\end{matrix} \right]}\\ \qquad \qquad\\\qquad\qquad\qquad\quad=e^{-\frac{1}{2\delta_1^2\delta_2^2}\cdot \left[ \begin{matrix} x_1-\mu_1& x_2-\mu_2\end{matrix} \right]\cdot\left[ \begin{matrix} \delta_{2} ^2& 0\\ 0& \delta_{1}^2 \end{matrix} \right]\cdot\left[ \begin{matrix} x_1-\mu_1\\ x_2-\mu_2\end{matrix} \right]}\\ \qquad \qquad\\\qquad\qquad\qquad\quad=e^{-\frac{1}{2\delta_1^2\delta_2^2}\cdot \left[ \begin{matrix} \delta_2^2\cdot(x_1-\mu_1)& \delta_1^2\cdot(x_2-\mu_2)\end{matrix} \right]\cdot\left[ \begin{matrix} x_1-\mu_1\\ x_2-\mu_2\end{matrix} \right]}\\ \quad \\= e^{-\frac{1}{2\delta_1^2\delta_2^2}\cdot[ \delta_2^2\cdot(x_1-\mu_1)^2+\delta_1^2\cdot(x_2-\mu_2)^2]}
\qquad好了通过上边公式的推导,我们可以看到通过多维情况下我们可以完整的得出二维情况下的高斯分布表达式。

4.心声

\qquad原理虽简单,但还是在纸上详细推导一遍比较好,不要眼高手低~~
加油呀,各位~。