统计学与工具实现(二)

离散差异性(variability)

对于一组数据的分布,除了数据的集中趋势量数(平均值,中位数,众数),组内数据间的差异也需要进行描述。

极差(range):最大值– 最小值

平均偏差(mean deviation):也叫平均绝对偏差

统计学与工具实现(二)

标准差(standarddeviation/SD/s):与均值的平均距离

统计学与工具实现(二)

这里用n-1而不是n,是无偏估计。因为我们用样本来预测总体,用n-1代替n,使得计算出的s可能比总体标准差要大,即高估了总体的标准差,

作为科学研究这是可以接受的,反之不行;如果只是计算样本的标准差,我们也可以采用有偏估计,用n即可。


方差(variance):标准差的平方

标准差的单位是原始计算单位,而方差的单位是平方单位;


极差可以给我们一个简单的数据分布印象,但是除了最小值和最大值,中间数值如何都未能得到刻画,目前使用最普遍的刻画数据总体离散差异的是标准差。


工具实现

Excel
统计学与工具实现(二)

R

统计学与工具实现(二)

Python

统计学与工具实现(二)