几种常见的概率分布及其一些统计量 (转载)


2018年存在我手机里的这2张图片
原文链接

图片

几种常见的概率分布及其一些统计量 (转载)
几种常见的概率分布及其一些统计量 (转载)

一些概念

偏度

皮尔逊偏度系数把偏度定义为
μ ~ 3 = E [ ( X − μ σ ) 3 ] = μ 3 σ 3 = E [ ( X − μ ) 3 ] ( E [ ( X − μ ) 2 ] ) 3 / 2 = κ 3 κ 2 3 / 2 \tilde{\mu}_{3}=\mathrm{E}\left[\left(\frac{X-\mu}{\sigma}\right)^{3}\right]=\frac{\mu_{3}}{\sigma^{3}}=\frac{\mathrm{E}\left[(X-\mu)^{3}\right]}{\left(\mathrm{E}\left[(X-\mu)^{2}\right]\right)^{3 / 2}}=\frac{\kappa_{3}}{\kappa_{2}^{3 / 2}} μ~3=E[(σXμ)3]=σ3μ3=(E[(Xμ)2])3/2E[(Xμ)3]=κ23/2κ3
其中 κ i \kappa_i κi是累积量
Skewness indicates the direction and relative magnitude of a distribution’s deviation from the normal distribution.

中位数

PDF曲线面积一半对应的位置

众数

PDF曲线最大值对应的位置

峰度

皮尔逊峰度系数把峰度定义为
Kurt ⁡ [ X ] = E [ ( X − μ σ ) 4 ] = E [ ( X − μ ) 4 ] ( E [ ( X − μ ) 2 ] ) 2 = μ 4 σ 4 \operatorname{Kurt}[X]=\mathrm{E}\left[\left(\frac{X-\mu}{\sigma}\right)^{4}\right]=\frac{\mathrm{E}\left[(X-\mu)^{4}\right]}{\left(\mathrm{E}\left[(X-\mu)^{2}\right]\right)^{2}}=\frac{\mu_{4}}{\sigma^{4}} Kurt[X]=E[(σXμ)4]=(E[(Xμ)2])2E[(Xμ)4]=σ4μ4
峰度是描述总体中所有取值分布形态陡缓程度的统计量。 这个统计量需要与正态分布相比较,峰度为3表示该总体数据分布与正态分布的陡缓程度相同;峰度大于3表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于3表示该总体数据分布与正态分布相比较为平坦,为平顶峰。

信息熵

连续分布 (应该叫做差熵)
h ( X ) = − ∫ − ∞ ∞ p ( x ) log ( p ( x ) ) d x h(X)=-\int\limits_{-\infty}^{\infty}p(x)\text{log}(p(x))dx h(X)=p(x)log(p(x))dx
离散分布
H ( X ) = − ∑ i [ p i ( x ) log ( p i ( x ) ) ] H(X)=-\sum\limits_{i}[p_i(x)\text{log}(p_i(x))] H(X)=i[pi(x)log(pi(x))]