正态分布(Normal Distribution)

正态分布的基本描述:

   在概率论里面,正态分布(或者叫高斯分布)是非常常见的连续概率分布。由于存在中心极限定理,这使得正态分布十分有用。中心极限定理表明,在观测数据非常大的时候,具有独立分布的独立随机变量的观测样本的平均值是收敛于正态分布的。正态分布的概率密度函数为:

正态分布(Normal Distribution)

   这里μ是分布的均值,或者叫期望值;σ是标准差;σ的平方是方差。

   另外,一个具有高斯分布的随机变量也被称为是具有正态分布的,这个变量被称为正态偏差。


标准正态分布:

   当μ=0和σ=1的时候,正态分布就是标准正态分布了。标准正态分布的概率密度函数如下:

正态分布(Normal Distribution)

   标准正态分布是关于x=0对称的,并且在x=0的时候获得最大值正态分布(Normal Distribution),而且标准正态分布的有两个拐点,分别是x=+1和x=-1。


通用正态分布:

   每一个正态分布都可以看成是由标准正态分布转化而成的,通过将标准正态分布的定义域先使用标准差σ进行拉伸,然后再平移μ个单位得到。公式如下。

正态分布(Normal Distribution)

   假定Z是一个标准的正态偏差,X=σZ+μ也是具有正态分布的正态偏差,X的期望值为μ,标准差为σ。相反的,如果X是一个期望值为μ、标准差为σ的正态偏差的话,那么通过转换Z=( X - μ ) / σ会得到一个标准正态分布,得到的变量Z也可以叫做X的标准形式。

   另外,每一个正态分布都可以写成以二次函数为自然常数的指数的形式。

正态分布(Normal Distribution)

   这里正态分布(Normal Distribution)正态分布(Normal Distribution)。在这种形式下,正态分布的均值为正态分布(Normal Distribution),方差为正态分布(Normal Distribution)。当正态分布为标准正态分布的时候,正态分布(Normal Distribution)正态分布(Normal Distribution)正态分布(Normal Distribution)


正态分布的表示符号:

   正态分布经常可以用正态分布(Normal Distribution)正态分布(Normal Distribution)表示。因此,当一个随机变量X是一个均值为μ和标准差为σ的正态偏差时,我们可以用这个形式表达:正态分布(Normal Distribution)


正态分布的属性:

   ①正态分布是关于x = μ对称的。

   ②正态分布曲线有两个拐点,分别在离均值一个标准差的位置,为x=μ-σ和x=μ+σ。

   ③对于任意的正态偏差X,Z = ( X - μ ) / σ是一个标准正态偏差。

   ④对于特定的期望值和方差,正态分布是具有最大熵的连续分布。

   ⑤由于对于离期望值好几个标准差范围之外的取值,它们的概率趋近于0。

   ⑥正态分布概率的覆盖范围遵循68-95-99.7的规定,这个规定又称为3-sigma规定。也就是说在距离均值一个标准差的范围内的取值的概率大概是68%,在两个标准差范围大概是95,在三个标准差范围大概是99.7%。


正态偏差上的操作:

   ①对正态偏差进行线性变换得到的也是正态偏差,如Y = aX + b,当X具有正态分布时,Y也具有正态分布。当X的期望值为μ,标准差为σ的时候,Y的期望值为aμ+b,标准差为|a|*σ。

   ②当X1和X2为两个独立的具有正态分布的随机变量时,如果它们的期望值分别是μ1和μ2,标准差为σ1和σ2,那么X1+X2也是具有正态分布的,对应的期望值为μ1+μ2,方差为σ1的平方加σ2的平方。

   ③独立正态偏差的线性组合也是一个正态偏差。

   ④无限可分性:对于任意正整数n,任意均值为μ和标准差为σ的正态分布都是n个独立正态偏差的和,每一个正态偏差均值为μ/n和方差为σ的平方除以n。

   ⑤Cramer分解定理:如果X1和X2都是独立随机变量且他们的和满足满足正态分布的话,那么,X1和X2一定是正态偏差。换句话说就是,当且仅当两个分布是正态分布时它们的卷积才是正态分布。

   ⑥Bernstein‘s定理:如果X和Y是独立的并且X+Y和X-Y也是独立的,那么X和Y都必须是满足正态分布的。


正太分布的属性图:

正态分布(Normal Distribution)正态分布(Normal Distribution)


参考资料:

正态分布-*  https://en.wikipedia.org/wiki/Normal_distribution