几种常见的概率分布及其一些统计量 (转载)
2018年存在我手机里的这2张图片
原文链接
图片
一些概念
偏度
皮尔逊偏度系数把偏度定义为
μ
~
3
=
E
[
(
X
−
μ
σ
)
3
]
=
μ
3
σ
3
=
E
[
(
X
−
μ
)
3
]
(
E
[
(
X
−
μ
)
2
]
)
3
/
2
=
κ
3
κ
2
3
/
2
\tilde{\mu}_{3}=\mathrm{E}\left[\left(\frac{X-\mu}{\sigma}\right)^{3}\right]=\frac{\mu_{3}}{\sigma^{3}}=\frac{\mathrm{E}\left[(X-\mu)^{3}\right]}{\left(\mathrm{E}\left[(X-\mu)^{2}\right]\right)^{3 / 2}}=\frac{\kappa_{3}}{\kappa_{2}^{3 / 2}}
μ~3=E[(σX−μ)3]=σ3μ3=(E[(X−μ)2])3/2E[(X−μ)3]=κ23/2κ3
其中
κ
i
\kappa_i
κi是累积量
Skewness indicates the direction and relative magnitude of a distribution’s deviation from the normal distribution.
中位数
PDF曲线面积一半对应的位置
众数
PDF曲线最大值对应的位置
峰度
皮尔逊峰度系数把峰度定义为
Kurt
[
X
]
=
E
[
(
X
−
μ
σ
)
4
]
=
E
[
(
X
−
μ
)
4
]
(
E
[
(
X
−
μ
)
2
]
)
2
=
μ
4
σ
4
\operatorname{Kurt}[X]=\mathrm{E}\left[\left(\frac{X-\mu}{\sigma}\right)^{4}\right]=\frac{\mathrm{E}\left[(X-\mu)^{4}\right]}{\left(\mathrm{E}\left[(X-\mu)^{2}\right]\right)^{2}}=\frac{\mu_{4}}{\sigma^{4}}
Kurt[X]=E[(σX−μ)4]=(E[(X−μ)2])2E[(X−μ)4]=σ4μ4
峰度是描述总体中所有取值分布形态陡缓程度的统计量。 这个统计量需要与正态分布相比较,峰度为3表示该总体数据分布与正态分布的陡缓程度相同;峰度大于3表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于3表示该总体数据分布与正态分布相比较为平坦,为平顶峰。
信息熵
连续分布 (应该叫做差熵)
h
(
X
)
=
−
∫
−
∞
∞
p
(
x
)
log
(
p
(
x
)
)
d
x
h(X)=-\int\limits_{-\infty}^{\infty}p(x)\text{log}(p(x))dx
h(X)=−−∞∫∞p(x)log(p(x))dx
离散分布
H
(
X
)
=
−
∑
i
[
p
i
(
x
)
log
(
p
i
(
x
)
)
]
H(X)=-\sum\limits_{i}[p_i(x)\text{log}(p_i(x))]
H(X)=−i∑[pi(x)log(pi(x))]