数学基础 - 第二十章 数据的分析
20.1 数据的集中趋势
20.1.1 平均数
上述问题(1)是利用平均数的公式计算平均成绩,其中的每个数据被认为同等重要.而问题(2)是根据实际需要对不同类型的数据赋予与其重要程度相应的比重,其中的2,1,3,4分别称为听、说、读、写四项成绩的权(weight),相应的平为数79.5,80.4分别称为甲和乙的听、说、读、写四项成绩的加权平均数(wcighted average).
20.1.2 中位数和众数
将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数 (median);如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数
一组数据中出现次数最多的数据称为这组数据的众数(modc).
20.2 数据的波动程度
来衡量这组数据波动的大小,并把它叫做这组数据的方差(variancc),记作s².
从上面计算方差的式子可以看出:当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大:当数据分布比较集中时,各个数据与平均数的差的平方和较小,方差就较小,反过来也成立,这样就可以用方差刻画数据的波动程度,即:方差越大,数据的波动越大:方差越小,数据的波动越小.