统计学与工具实现(二)
离散差异性(variability)
对于一组数据的分布,除了数据的集中趋势量数(平均值,中位数,众数),组内数据间的差异也需要进行描述。
极差(range):最大值– 最小值
平均偏差(mean deviation):也叫平均绝对偏差
标准差(standarddeviation/SD/s):与均值的平均距离
这里用n-1而不是n,是无偏估计。因为我们用样本来预测总体,用n-1代替n,使得计算出的s可能比总体标准差要大,即高估了总体的标准差,
作为科学研究这是可以接受的,反之不行;如果只是计算样本的标准差,我们也可以采用有偏估计,用n即可。
方差(variance):标准差的平方
标准差的单位是原始计算单位,而方差的单位是平方单位;
极差可以给我们一个简单的数据分布印象,但是除了最小值和最大值,中间数值如何都未能得到刻画,目前使用最普遍的刻画数据总体离散差异的是标准差。
工具实现
Excel