常用的数量统计量的计算及统计意义
数量统计量是只适合数量类型数据的统计量,使我们最常见的统计量。笔者之前对资料特征数的计算作了简单地介绍,详情可跳转至 资料特征数的计算,本篇博客力求全面和简洁易懂。
对于数量类型的数据样本
-
均值(Mean)
X⎯⎯⎯=1n∑n1Xi
很简单,用来描述数据取值的平均位置。 -
方差(Sample Variance)
S2n=1n−1∑(Xi−X⎯⎯⎯)2
至于为何分母为 n-1,同样点击传送门:资料特征数的计算。 -
标准差(Standard Deviation)
Sn=1n−1∑(Xi−X⎯⎯⎯)2‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√
标准差在数值上等于方差的开平方,他们都是用来反应数据取值的离散(变异)程度的。标准差的量纲与数据的量纲相同。 -
变异系数(Coefficient of Variation,CV)
CV=SnX⎯⎯
标准差与均值的比值成为变异系数。它是一个无量纲的量,用来刻画数据的相对分散性。 -
标准误(Standard Error)
1n−1∑n1(Xi−X⎯⎯)2√n√=1n(n−1)∑n1(Xi−X⎯⎯⎯)2‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√
标准误是由样本的标准差除以样本个数的开平方计算得到的。标准误代表的就是样本均数对总体均数的相对误差。 -
偏度(Skewness)
skewness=n√∑n1(Xi−X⎯⎯)3[∑n1(Xi−X⎯⎯)2]32
偏度是用来刻画数据对称性的指标。关于均值对称的数据,其偏度系数为0;若左侧数据比较分散,则偏度系数小于0;若右侧数据比较分散,则偏度系数大于0。在图像上的差别为:正态分布的偏度为0,如果 skewness>0 代表波形有右侧长尾(正偏),如果 skewness < 0 代表波形有左侧长尾(反偏)。图像如下(左图为反偏,右图为正偏):
在 MATLAB 中对应的函数即为 skewness().
-
峰度(Kurtosis)
kurtosis=n∑n1(Xi−X⎯⎯)4[∑n1(Xi−X⎯⎯)2]2−3
峰度可以描述样本数据分布形态相对于正态分布的陡峭程度。- 若 Kurtosis=0,则与正态分布的陡峭程度相同;
- 若 Kurtosis>0,则比正态分布的高峰更加陡峭,表现为尖顶峰;
- 若 Kurtosis<0,则比正态分布的高峰显得平缓,表现为平顶峰。
在 MATLAB 中对应的函数即为 kurtosis().
偏度与峰度可以用来描述样本数据分布形状,如果是正态分布,那么偏度为0,峰度也为0.